Présentation de l'équipe
Les données linguistiques sont présentes dans tous les médias, que cela soit sous forme de
textes écrits ou transcrits à partir de bandes sonores, de sous-titrages, d’annotations. L’accès au
contenu du document nécessite une analyse linguistique afin d’accéder aux informations
pertinentes pour une application donnée. L’équipe Traitement Automatique du Langage Naturel
(TALN) développe des méthodes et des outils d’analyse linguistiques robustes pour traiter des
masses de données textuelles.
Axes de recherche
Les travaux de l’équipe comportent donc des recherches à caractère fondamental et des
recherches appliquées portant sur le lexique, la syntaxe et la sémantique des documents écrits.
Les thèmes de recherches de l’équipe se concentrent sur le traitement du multilinguisme et du
multimedia et s’articulent autour de :
-
Théorie des langages caractérisation des modèles linguistiques du point de vue de leur
expressivité et des liens qu’ils entretiennent avec d’autres formalismes.
-
Analyse et acquisition lexicale méthodes d’alignement et de détection dans les textes
d’unités lexicales non présentes dans les dictionnaires comme celles relevant de domaines de
spécialités ou de nouvelles formes d’expressions langagières.
-
Analyse et acquisition grammaticale méthodes d’inférences robustes de grammaires
lexicalisées avec une adaptation de modèles stochastiques ou mixte à diverses applications.
-
Analyse du discours et des documents définition de modèles prédicatifs du discours, méthodes
d’analyse sémantique-textuelle pour la détection des opinions ou la reprise de contenu.