Evaluation automatique de productions lexicales : une analyse à 4 niveaux
Résumé
De nombreuses activités pour l'apprentissage des langues incluent des tests destinés à l'autoévaluation de l'apprenant. Dans bien des cas, ces tests s'appuient sur des questions fermées du type QCM. Lorsque les questions sont semi-ouvertes, comme les quiz ou les tests de closure, les réponses font souvent l'objet d'un traitement binaire : ces tests sont traités comme des questions fermées, ignorant la variabilité des réponses de l'apprenant. Pour pallier ce manque, nous proposons de recourir à des techniques simples et maîtrisées issues du traitement automatique des langues : normalisation, étiquetage morphosyntaxique, lemmatisation et consultation de lexique sémantiques (type Wordnet). Afin de minimiser l'effet de certaines ambiguïtés (morphosyntaxiques et sémantiques) nous proposons une heuristique de moindre différence, où la réponse de l'apprenant joue le rôle d'indice permettant d'orienter, par similarité, l'analyse linguistique. Nous avons implanté ces principes dans un prototype effectuant une évaluation automatique à quatre niveaux, afin de distinguer différents types de différences : différences superficielles, différences orthographiques, différences morphosyntaxiques, différences lexicosémantiques. Ce prototype entre actuellement en phase de test : par la mise en ligne d'exercices lacunaires, nous prévoyons de recueillir un corpus de réponses d'apprenants, qui nous permettra d'évaluer la validité de notre approche et d'affiner les feed-back de notre système.
Origine : Fichiers produits par l'(les) auteur(s)