Analiza automată a materialelor şcolare franceze din prisma complexităţii textuale

Résumé : Eforturile de cercetare în ceea ce priveşte analiza complexităţii textuale automate se concentrează în principal asupra limbii engleze, în prezent existând doar câteva adaptări pentru alte limbi. Pornind de la un fundament solid în ceea ce priveşte analiza discursului şi analiza complexităţii textuale bazată pe un model de evaluare validat pentru limba engleză, în lucrarea de faţă introducem un model de analiză textuală pentru limba franceză antrenat pe 200 de documente extrase din manuale şcolare franţuzeşti, pre-clasificate în cinci clase de complexitate textuală. Factorii de analiză acoperă o multitudine de dimensiuni şi sunt distribuiţi în următoarele categorii principale: de suprafaţă, factori specifici analizei sintactice, morfologice, semantice şi analiza discursului, metrici care ulterior sunt combinate prin intermediul maşinilor cu vector suport (Support Vector Machines – SVM) pentru îmbunătăţirea preciziei. La nivel global, adiţional faţă de factorii pur cantitativi de suprafaţă, anumite părţi de vorbire şi diverse metrici de coeziune s-au dovedit a fi predictori de încredere raportat la nivelul de dificultate al materialelor şcolare, creând astfel o bază consistentă pentru a construi modele de încredere de evaluare automată a complexităţii textuale franceze. Cuvinte cheie coeziunea textelor, evaluarea complexităţii textuale, lizibilitatea, metode kernel, maşini cu vector suport (Support Vector Machines) Clasificare ACM I.2.7 Natural Language Processing. INTRODUCERE Notarea automată a eseurilor, identificarea de modele şi şabloane textuale sau evaluarea dificultăţii textelor reprezintă subiecte de interes în prezent în domeniul analizei textuale, a căror aplicabilitate se adresează atât mediilor academice, cât şi celor comerciale, din prisma alinierii optime la nivelul de înţelegere al cursanţilor. Pe de-o parte, grupurile de cercetare se concentrează pe analiza şi inter-conectarea volumelor mari de texte extrase din web-ul social într-o continuă extindere, în timp ce piaţa comercială este axată pe dezvoltarea de instrumente de analiză care ar putea îmbunătăţi predicţia nivelului de înţelegere şi ar putea induce un control mai bun al fluxului de informaţii de la sursă către publicul ţintă. Un dezavantaj major al eforturilor de analiză automată a complexităţii textuale provine din lipsa de conţinut suficient în cazul unor limbi precum limba franceză, în comparaţie cu limbile pentru care există astfel de resurse (spre ex., engleza). Prin urmare, analiza multi-linguală a complexităţii textuale este încă un domeniu puţin explorat care ar putea reliefa rezultate surprinzătoare raportat la următoarele dimensiuni ale evaluării: complexitatea vocabularului, morfologia şi structura discursului. Indiferent de nivelul de analiză adresat, scopul final presupune îmbunătăţirea nivelului de înţelegere al cursanţilor.
Type de document :
Communication dans un congrès
D. M. Popovici; D. D. Iordache. 11-a Conferinta Nationala de Interactiune Om-Calculator – RoCHI 2014, Sep 2014, Bucharest, Romania. 11-a Conferinta Nationala de Interactiune Om-Calculator – RoCHI 2014, pp.55-60, 2014, 〈http://rochi.utcluj.ro/proceedings/en/articles-RoCHI2014.php〉
Liste complète des métadonnées

Littérature citée [24 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/hal-01217028
Contributeur : Philippe Dessus <>
Soumis le : dimanche 18 octobre 2015 - 17:32:54
Dernière modification le : jeudi 21 juin 2018 - 15:28:03
Document(s) archivé(s) le : mardi 19 janvier 2016 - 10:31:29

Fichier

RoCHI-2014-Dascalu.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-01217028, version 1

Collections

TICE | LSE | UGA

Citation

Mihai Dascălu, Lucia Larise, Ștefan Trăușan-Matu, Philippe Dessus, Maryse Bianco. Analiza automată a materialelor şcolare franceze din prisma complexităţii textuale. D. M. Popovici; D. D. Iordache. 11-a Conferinta Nationala de Interactiune Om-Calculator – RoCHI 2014, Sep 2014, Bucharest, Romania. 11-a Conferinta Nationala de Interactiune Om-Calculator – RoCHI 2014, pp.55-60, 2014, 〈http://rochi.utcluj.ro/proceedings/en/articles-RoCHI2014.php〉. 〈hal-01217028〉

Partager

Métriques

Consultations de la notice

563

Téléchargements de fichiers

303