Partenaires



Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > A la une

Colloque : « Corpus oraux, corpus écrits : pratiques croisées »

18 octobre 2017

English version here

13 et 14 novembre 2017

Colloque co-organisé par le projet CORAL, les laboratoires Praxiling (UMR 5267), Dipralang (EA 739) et CRISES (EA 4424)

Lundi 13 novembre, de 9h30 à 12h30 et de 14h à 19h, Saint Charles 2, salle 002 « Caryatides »
Lundi 14 novembre, de 9h à 12h30 et de 14h à 18h, Saint Charles 2, salle 002 « Caryatides »

PDF - 336.7 ko
Programme du colloque Corpus oraux, corpus écrits : pratiques croisées
PDF - 362.7 ko
Livret de résumés

Conférenciers invités : Stefan Evert (FAU Erlangen-Nürnberg), Bente Maegaard (Centre for Language Technologie, University of Copenhagen), Damon Mayaffre (BCL UMR 7320, Université Nice Sophia Antipolis), Christophe Parisse (Modyco UMR 7114, Université Paris Ouest Nanterre).

Inscription à l’adresse suivante :
christelle.dodane@univ-montp3.fr

Argument

La constitution de ressources linguistiques représente depuis de nombreuses années l’une des productions majeures pour les chercheurs et les laboratoires en sciences humaines et sociales (SHS). Dans le domaine des sciences du langage, l’exploitation et l’analyse des données langagières ont connu un bond en avant avec l’apport des linguistiques de corpus et des traitements informatiques. D’une part, il s’avère indispensable de fédérer des pratiques scientifiques établies ou émergentes, relativement divergentes selon différents domaines (phonétique/phonologie, lexique, morpho-syntaxe, sémantique, linguistique des textes et des discours) et communautés. D’autre part, il s’agit, pour la linguistique outillée, de rendre accessibles ses acquis et méthodes à tous les chercheurs en SHS, qui fondent leurs travaux sur l’analyse de données langagières qu’elles relèvent de productions écrites, orales ou multimodales.

L’objectif de ce colloque est de faire dialoguer ces différentes communautés de chercheurs, qu’ils soient producteurs ou utilisateurs de ressources et/ou d’outils. Les approches méthodologiques qui associent différents modes d’exploitation et d’analyse de corpus oraux et écrits seront particulièrement attendues.

Il s’agira notamment d’aborder les problématiques suivantes :

  • Annotation (phonétique, prosodique, gestuelle, morphosyntaxique, sémantique, etc.) ;
  • Standardisation des annotations et du balisage ;
  • Mise en place d’un format commun aux corpus écrits et oraux, permettant d’assurer l’interopérabilité entre les deux types de données ;
  • Exploitation automatique ou semi-automatique et analyse des données ;
  • Mutualisation des ressources (corpus annotés, schémas d’annotation, lexiques, patrons ou grammaires...) ;
  • Adaptation et/ou création d’applications pour le traitement et l’exploitation des données orales et écrites.

Comité d’organisation : Beatrice Dal Bo (Praxiling, UM3), Sascha Diwersy (Praxiling, UM3), Christelle Dodane (Praxiling, UM3), Souad El Fellah (Praxiling, UM3), Hubert Gbedahou (Praxiling, UM3), Myriam Maréchal (UM3), Bénédicte Pivot (Dipralang, UM3), Bieke Van Camp (CRISES, EA 4424).

Comité scientifique :

  • Nathalie Auger (Praxiling, UM3)
  • Melissa Barkat-Defradas (Institut des Sciences de l’Evolution, UMR 5554, Montpellier 2)
  • Sascha Diwersy (Praxiling, UM3)
  • Christelle Dodane (Praxiling, UM3)
  • Stefan Evert (FAU Erlangen-Nürnberg)
  • Francesca Frontini (Praxiling, UM3)
  • Fabrice Hirsch (Praxiling, UM3)
  • Agata Jackiewicz (Praxiling, UM3)
  • Marie-Paule Jacques (Laboratoire LIDILEM, Université Grenoble Alpes)
  • Dominique Legallois (Université Sorbonne Nouvelle, CLESTHIA)
  • Giancarlo Luxardo (Praxiling, UM3)
  • Bente Maegaard (Centre for Language Technologie, University of Copenhagen)
  • Damon Mayaffre (BCL UMR 7320, Université Nice Sophia Antipolis)
  • Rachel Panckhurst (Praxiling, UM3)
  • Christophe Parisse (Modyco, Université Paris Ouest Nanterre)
  • Bénédicte Pivot (Dipralang, UM3)
  • Agnès Tutin (LIDILEM, Université Grenoble Alpes)

International workshop : “Speech corpora, text corpora : sharing practices”

Date and location of the workshop : November 13 & 14, 2017, Room 002 “Caryatides”, Saint Charles 2 Site, Université Paul-Valéry Montpellier 3

Organization : Project CORAL, Praxiling (UMR 5267) & DIPRALANG (EA 739) laboratories

Invited speakers : Stefan Evert (FAU Erlangen-Nürnberg), Bente Maegaard (Centre for Language Technologie, University of Copenhagen), Damon Mayaffre (BCL UMR 7320, Université Nice Sophia Antipolis), Christophe Parisse (Modyco UMR 7114, Université Paris Ouest Nanterre).

Registration by email :
christelle.dodane@univ-montp3.fr

Argument

The constitution of language resources represents one of the major productions for researchers and laboratories in social sciences and humanities (SSH) in many years. In the field of language sciences, the exploitation and analysis of linguistic data have made a significant leap forward with the contribution of corpus linguistics and computer processes. Firstly, it proves vital in uniting established and emerging scientific practices, relatively divergent according to different fields (phonetics/phonology, lexicon, morphosyntax, semantics, text linguistics and discourse linguistics) and communities. Secondly, it is a matter of making the benefits and methods of tool-assisted linguistic analysis accessible to all SSH researchers, who base their works on the analysis of linguistic data, whether text, speech or multimodal productions.

The goal of this symposium is to create a dialogue between these different communities of researchers, whether they be producers or users of resources and/or tools. The methodological approaches that associate different modes of exploitation and analysis of speech and text corpora will be particularly welcomed.

The main focus will be on addressing the following issues :

  • Annotation (phonetic, prosodic, gestural, morphosyntactic, semantic, etc.) ;
  • Standardization of annotations and markups ;
  • Establishment of a common format for speech and text corpora, allowing for the assurance of interoperability between the two types of data ;
  • Automatic or semi-automatic exploitation and data analysis ;
  • Sharing of resources (annotated corpora, annotation schemas, lexicons, patterns or grammars...) ;
  • Adaptation and/or creation of applications for the processing and exploitation of speech and text data

Organizing committee : Beatrice Dal Bo (Praxiling, UM3), Sascha Diwersy (Praxiling, UM3), Christelle Dodane (Praxiling, UM3), Hubert Gbedahou (Praxiling, UM3), Myriam Maréchal (UM3), Bénédicte Pivot (Dipralang, UM3), Bieke Van Camp (CRISES, EA 4424)

Programme committee :

  • Nathalie Auger (Praxiling, UM3)
  • Melissa Barkat-Defradas (Institut des Sciences de l’Evolution, UMR 5554, Montpellier 2)
  • Sascha Diwersy (Praxiling, UM3)
  • Christelle Dodane (Praxiling, UM3)
  • Stefan Evert (FAU Erlangen-Nürnberg)
  • Francesca Frontini (Praxiling, UM3)
  • Fabrice Hirsch (Praxiling, UM3)
  • Agata Jackiewicz (Praxiling, UM3)
  • Marie-Paule Jacques (Laboratoire LIDILEM, Université Grenoble Alpes)
  • Dominique Legallois (Université Sorbonne Nouvelle, CLESTHIA)
  • Giancarlo Luxardo (Praxiling, UM3)
  • Bente Maegaard (Centre for Language Technologie, University of Copenhagen)
  • Damon Mayaffre (BCL UMR 7320, Université Nice Sophia Antipolis)
  • Rachel Panckhurst (Praxiling, UM3)
  • Christophe Parisse (Modyco, Université Paris Ouest Nanterre)
  • Bénédicte Pivot (Dipralang, UM3)
  • Agnès Tutin (LIDILEM, Université Grenoble Alpes)