Explorer des corpus à l'aide de CasSys. Application au Corpus d'Orléans - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2013

Explorer des corpus à l'aide de CasSys. Application au Corpus d'Orléans

Résumé

Cet article présente un outil d'exploration de corpus, CasSys, facilement paramétrisable par les linguistes, permettant de reconnaître des motifs même complexes et de les baliser, éventuellement par des balises XML. Ce balisage automatique peut ensuite être révisé par un expert. CasSys est donc un outil d'exploration de corpus, mais également d'annotation enrichie semi-supervisée. Deux exemples réels complèteront cette présentation : la recherche des entités nommées du Corpus d'Orléans et l'utilisation de ces entités pour connaître des informations sur les personnes répondant à l'enquête qui constitue ce corpus. Ce travail a bénéficié du financement du projet ANR Variling et d'un projet Feder Région Centre. Il a aussi été testé dans le cadre de l'évaluation Ester2 (campagne d'évaluation des systèmes de transcription enrichie d'émissions radiophoniques) .
Fichier principal
Vignette du fichier
JLC2009.pdf (144.59 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01174606 , version 1 (17-07-2015)

Identifiants

  • HAL Id : hal-01174606 , version 1

Citer

Denis Maurel, Nathalie Friburger, Iris Eshkol, Jean-Yves Antoine. Explorer des corpus à l'aide de CasSys. Application au Corpus d'Orléans. Journées de Linguistique de Corpus, Sep 2009, Lorient, France. pp.189-196. ⟨hal-01174606⟩
142 Consultations
155 Téléchargements

Partager

Gmail Facebook X LinkedIn More