Partenaires



Rechercher

Sur ce site

Sur le Web du CNRS


Accueil du site > Equipes de recherche > STRUCTURE TRANSVERSALE : Linguistique outillée

Linguistique outillée : ressources, modélisations et traitements informatiques

15 septembre 2017

La structure a pour objet le développement d’une réflexion commune et croisée, d’ordre méthodologique et épistémologique, sur la constitution des ressources et la conception des dispositifs expérimentaux en linguistique.

La transversalité de la structure permettra de couvrir l’essentiel du périmètre scientifique de chacune des équipes internes du laboratoire Praxiling.

Responsable : Agata Jackiewicz

Principaux participants : Hervé Bohbot, Bruno Bonu, Sascha Diwersy, Christelle Dodane, Francesca Frontini, Corinne Gomila, Fabrice Hirsch, Agata Jackiewicz, Giancarlo Luxardo, Rachel Panckhurst, Agnès Steuckardt

Contexte

La constitution de ressources linguistiques représente depuis de nombreuses années l’une des productions majeures pour les chercheurs et les laboratoires en sciences humaines et sociales. Dans le domaine des sciences du langage, le traitement de ces données a connu un bond en avant avec l’apport de la linguistique de corpus et du traitement informatique.

Le laboratoire Praxiling, spécialisé dans l’analyse de discours socialement situés, dispose aujourd’hui de plusieurs dizaines de corpus de productions langagières écrites ou orales, brutes ou enrichies, présentant différents degrés d’achèvement et diversement documentés. Le recensement, la normalisation et la valorisation de ces ressources est nécessaire pour les pérenniser et encourager leur réutilisation.

Progresser dans l’exploitation scientifique de ces données et ressources, à des fins tant théoriques que pratiques, permettra d’étendre le champ des connaissances sur la langue, mais aussi de mieux répondre à des besoins exprimés dans le monde social, politique et économique.

Finalités

Dans la tradition des recherches menées au sein du laboratoire Praxiling, les travaux de la structure transversale participent au questionnement commun sur la construction du sens en usage et en discours. La structure s’appuie sur les chercheurs en linguistique outillée et en TAL, en collaboration avec l’ensemble des linguistes intéressés par les questions de modélisation et de traitement de corpus.

Les travaux portent globalement sur le développement des méthodologies de recherche par le recours à des modélisations et des outils informatiques. L’objectif est de pouvoir approcher ou reconsidérer les phénomènes langagiers à la lumière de données à grande échelle, assorties de méthodes d’observation efficaces, falsifiables et reproductibles.

Une attention particulière est portée aux questions posées par la collecte, le formatage, l’annotation et l’analyse des observables langagiers attestés, en tenant compte de leur complexité inhérente. On s’attache à définir des méthodes innovantes permettant de travailler sur : (i) des productions à caractère multimodal, (ii) des données hétérogènes et réticulaires, (iii) des discours « sensibles », (iv) des discours en interaction, (v) des collections de données dictionnairiques, etc.

La linguistique expérimentale est pratiquée de manière raisonnée et critique face aux outillages parfois trop complexes et opaques, en évitant la survalorisation du quantitatif, en dialogue interdisciplinaire. Elle développe également une réflexion épistémologique sur les catégories linguistiques pertinentes qui interviennent dans la constitution et les usages de corpus.

Activités

Projets en cours