Skip to Main content Skip to Navigation
Conference papers

Analiza automată a materialelor şcolare franceze din prisma complexităţii textuale

Résumé : Eforturile de cercetare în ceea ce priveşte analiza complexităţii textuale automate se concentrează în principal asupra limbii engleze, în prezent existând doar câteva adaptări pentru alte limbi. Pornind de la un fundament solid în ceea ce priveşte analiza discursului şi analiza complexităţii textuale bazată pe un model de evaluare validat pentru limba engleză, în lucrarea de faţă introducem un model de analiză textuală pentru limba franceză antrenat pe 200 de documente extrase din manuale şcolare franţuzeşti, pre-clasificate în cinci clase de complexitate textuală. Factorii de analiză acoperă o multitudine de dimensiuni şi sunt distribuiţi în următoarele categorii principale: de suprafaţă, factori specifici analizei sintactice, morfologice, semantice şi analiza discursului, metrici care ulterior sunt combinate prin intermediul maşinilor cu vector suport (Support Vector Machines – SVM) pentru îmbunătăţirea preciziei. La nivel global, adiţional faţă de factorii pur cantitativi de suprafaţă, anumite părţi de vorbire şi diverse metrici de coeziune s-au dovedit a fi predictori de încredere raportat la nivelul de dificultate al materialelor şcolare, creând astfel o bază consistentă pentru a construi modele de încredere de evaluare automată a complexităţii textuale franceze. Cuvinte cheie coeziunea textelor, evaluarea complexităţii textuale, lizibilitatea, metode kernel, maşini cu vector suport (Support Vector Machines) Clasificare ACM I.2.7 Natural Language Processing. INTRODUCERE Notarea automată a eseurilor, identificarea de modele şi şabloane textuale sau evaluarea dificultăţii textelor reprezintă subiecte de interes în prezent în domeniul analizei textuale, a căror aplicabilitate se adresează atât mediilor academice, cât şi celor comerciale, din prisma alinierii optime la nivelul de înţelegere al cursanţilor. Pe de-o parte, grupurile de cercetare se concentrează pe analiza şi inter-conectarea volumelor mari de texte extrase din web-ul social într-o continuă extindere, în timp ce piaţa comercială este axată pe dezvoltarea de instrumente de analiză care ar putea îmbunătăţi predicţia nivelului de înţelegere şi ar putea induce un control mai bun al fluxului de informaţii de la sursă către publicul ţintă. Un dezavantaj major al eforturilor de analiză automată a complexităţii textuale provine din lipsa de conţinut suficient în cazul unor limbi precum limba franceză, în comparaţie cu limbile pentru care există astfel de resurse (spre ex., engleza). Prin urmare, analiza multi-linguală a complexităţii textuale este încă un domeniu puţin explorat care ar putea reliefa rezultate surprinzătoare raportat la următoarele dimensiuni ale evaluării: complexitatea vocabularului, morfologia şi structura discursului. Indiferent de nivelul de analiză adresat, scopul final presupune îmbunătăţirea nivelului de înţelegere al cursanţilor.
Complete list of metadatas

Cited literature [24 references]  Display  Hide  Download

https://hal.archives-ouvertes.fr/hal-01217028
Contributor : Philippe Dessus <>
Submitted on : Sunday, October 18, 2015 - 5:32:54 PM
Last modification on : Friday, March 27, 2020 - 10:31:11 AM
Document(s) archivé(s) le : Tuesday, January 19, 2016 - 10:31:29 AM

File

RoCHI-2014-Dascalu.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : hal-01217028, version 1

Collections

TICE | LSE | UGA | TEL

Citation

Mihai Dascălu, Lucia Larise, Ștefan Trăușan-Matu, Philippe Dessus, Maryse Bianco. Analiza automată a materialelor şcolare franceze din prisma complexităţii textuale. 11-a Conferinta Nationala de Interactiune Om-Calculator – RoCHI 2014, Sep 2014, Bucharest, Romania. pp.55-60. ⟨hal-01217028⟩

Share

Metrics

Record views

633

Files downloads

513