Classification des catégories grammaticales sur deux corpus longitudinaux d’enfants - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2020

Classification des catégories grammaticales sur deux corpus longitudinaux d’enfants

J. Sauvage
Giovanni Pirrotta
  • Fonction : Auteur
  • PersonId : 1084996
Massimo Mucciardi
  • Fonction : Auteur
  • PersonId : 1084997

Résumé

Cet article analyse deux suivis longitudinaux de deux enfants du projet CoLaJE: une annotation automatique des parties du discours a été appliquée à chaque énoncé (15'000 en total) en adoptant le standard des « Universal Dependencies » comme référence et « stanza », un librairie Python, comme outil d’analyse. L’âge et le taux d’erreur ont servi comme base pour la création de neuf strata: réduire la dimension du corpus nous permet de rendre intérpretables les groupements crées avec une méthode non-supervisée, EM clustering. Regrouper en clusters les énoncés des enfants annotés en parties du discours aide à mieux cibler le développement des catégories grammaticales au cours du temps: deux exemples concernants le développement de la cohérence morphosintaxique sont proposés, ainsi que deux exemples concernants l’évolution de la relation entre l’usage de pronoms et des noms. Une discussion finale des résultats et des limites de cette recherche est ensuite proposée..
Fichier principal
Vignette du fichier
4.pdf (2.67 Mo) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03047149 , version 1 (03-01-2021)

Identifiants

  • HAL Id : hal-03047149 , version 1

Citer

Andrea Briglia, J. Sauvage, Giovanni Pirrotta, Massimo Mucciardi. Classification des catégories grammaticales sur deux corpus longitudinaux d’enfants. 2èmes journées scientifiques du Groupement de Recherche Linguistique Informatique Formelle et de Terrain (LIFT), 2020, Montrouge, France. pp.28-38. ⟨hal-03047149⟩

Collections

UNIV-MONTP3
66 Consultations
53 Téléchargements

Partager

Gmail Facebook X LinkedIn More