Ecole Thématique : Annotation de données langagières

Version imprimableEnvoyer à un ami

La linguistique mais aussi d’autres domaines au sein des sciences sociales font de plus en plus appel à l’utilisation de corpus (ou au moins de données écrites ou orales attestées) pour effectuer des recherches très diverses. Malgré cette diversité, des besoins communs sont avérés, notamment au niveau de l’enrichissement de ces données par des annotations (syntaxiques, sémantiques, pragmatiques). Or ces pratiques s’apprennent largement « sur le tas ». C’est pourquoi il paraît important de répondre à un besoin de formation et de dialogue autour de la notion d’annotation, pour unifier les pratiques, faire émerger une communauté et faire profiter les uns et les autres de retours d’expérience.

Les laboratoires LaTTiCe (UMR 8094) et MoDyCo (UMR 7114) organisent, sous l’égide du CNRS, et avec le soutien du TGE Adonis,  une école thématique consacrée à l’annotation de données langagières. Cette école sera consacrée à l’enrichissement de ces données avec différents types d’annotations permettant une analyse (repérage de patrons, de régularités, comptages, etc.) et allant au-delà des simples formes de surface. Cette école se veut complémentaire d’autres initiatives visant plus spécialement l’élaboration de corpus et/ou leur analyse statistique.

Différents types de corpus sont concernés : écrits, oraux, vidéo, etc. Les interventions couvriront une large gamme de questions, allant par exemple de l’annotation de l’ancien français jusqu’à l’analyse de la langue des signes. Au-delà de cette diversité, il s’agira de faire ressortir des questions et des pratiques communes (Quoi annoter ? Avec quels outils ? Quelle complémentarité entre approche manuelle et approche automatique ? Comment mesurer la qualité de l’annotation et/ou l’accord entre annotateurs ? etc.).

L’école thématique aura lieu du 10 au 15 septembre 2011 au Domaine de Françon à Biarritz.

Elle est ouverte aux doctorants, aux enseignants-chercheurs et aux chercheurs concernés et intéressés. Le but est de faire partager un ensemble de pratiques et à terme, de faire émerger une communauté autour de l’annotation de données.

Les conditions d’inscription sont disponibles sur le site web de l’école : ecoleannotation [at] gmail [dot] com (http://annotationlinguistique.fr/).

Le nombre de places étant limité, un CV et une courte lettre de motivation devront être fournis. La sélection des candidatures sera faite, le cas échéant, par les organisateurs, en collaboration avec le comité scientifique de l’école.

L’inscription est gratuite pour les personnels CNRS. Elle s’élève à 150 euros pour les doctorants et à 450 euros pour les personnels non CNRS ou privés (inscriptions à l’école + frais de séjour). Les frais de déplacement sont à la charge des participants.

Les pré-inscriptions sont ouvertes jusqu’au 15 mai 2011.

Pour plus de renseignements, veuillez vous adresser à l’adresse suivante:  ecoleannotation [at] gmail [dot] com
 

Article lié à