Outillage de l'accès aux textes par la lecture active étymologique multilingue pour apprenants berbérophones et arabophones - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Outillage de l'accès aux textes par la lecture active étymologique multilingue pour apprenants berbérophones et arabophones

Résumé

Asfecku n tezmareft ɣer yeḍrisen s tɣuri turmiṭ tagmuẓaṛt tagtutlayant I nelmaden imaziɣen d w aɛraben Deg wahil n usenfar Etymolo n LIG-GETALP, tamuγli nneγ twehha γer leqraya turmiṭ tigertutlayant I yinelmaden imaziγen i ylemden taɛrabt, tarumit, sakin ad nwali tamaziγt s lwelha taγlant. Di teswiɛt icuban tagi, lemɛawna am tγuri turmiṭ tezmer ad tili d ayen inefɛen s waṭas, ilaq ad tili tagtutlayant. Imi llan watas n wawalen yettemcabin ger tutlayin agi, akken ittwanṭaqen neγ i twarun γef demma n yissaγen igmuẓar, nesummer-d anɛiwen inelmaden di leqraya nsen tamawalant mi ara sen nesken awalen ittemcabin mi ara ten-nlemden, s wayagi ad naweḍ γer leqraya turmiṭ tagtutlayant. Nwala lemɛawnat deg watas n teswiɛin tissediyin d usnarni n ugrudem n CESSELIN/LECTURE (i tjapunit d tfransist) iwakken ad nesken igdazalen imawalen ger n yiwet d wukuz n tutlayin daγen ad as-d-nernu "tagmuẓart" iwakknen ad tɛiwen akken iwata. Γef lsas n Cesselin/lecture nebna-d asimeγ n ugrudem agi, tamaziγt d taγbalut, taɛrabt tantala d tefransist d tinicanin. Imi d ayen icudden γer tutlayin ur yesɛin ara tawilat meqren, aγbel nneγ amenzu mi ara d-nettnadi neγ ad nebnu tiɣbula ilaqen, ger-asen atas n wawalen ittemcabin ger tutlayin, azadur amawalan ara yettwaqedcen i yal tutlayt. Aqlaγ nettheyyi isegzawalen i tutlayt n tmaziγt iwakken ad tt-ner di teγerγert Jibiki, arnu-yas ugriwen aynutlayen s tmaziγt (s tfinaγ neγ s tmamrit) s umasal XML d ustengel UTF-8.
Helping access to texts through etymological multilingual active reading for learners of Berber and Arabic In the context of the Etymolo project of LIG-GETALP, we are interested in active reading for Berber speakers, schooled in Arabic, then in French, then studying Berber formally. In this type of situations, a help like active reading can be very useful, and should be multilingual. Since there are many "cognates" (complete synonyms or words spelt in the same manner but not having the same meaning) between these languages, as spoken or written words, because of etymological relationships or borrowed words, we propose to help learners in their lexical learning by showing them the "cognates" of the words in the text they read, coming then to the concept of etymological active reading (LAE). We identified the possible helps in ten real situations and specified an extension of the CESSELIN/LECTURE interface (dedicated to Japanese-French) that will show the lexical equivalents in 1 to 4 target languages, and include the "etymological" aspect, so that it constitutes a significant help. On the basis of CESSELIN/LECTURE, we have produced a simulation of this extended interface, with Berber as source, and French, Arabic and Algerian Arabic dialect as targets. Since we handle under-resourced language pairs, our first problem is to collect or constitute necessary resources, that is a large set of cognates between these languages, a lexical basis usable for each language pair, and a lemmatizer for each language. In the case of Berber, we are collecting dictionaries and putting them in the JIBIKI platform, as well as monolingual corpora in Berber (written in tifinagh or tamamritrit-latin), all of these in XML format and UTF-8 encoding.
Dans le cadre du projet Etymolo du LIG-GETALP, nous nous intéressons à la lecture active pour apprenants berbérophones, scolarisés en arabe, puis en français, puis étudiant le berbère de façon formelle. Dans ce type de situations, une aide de type lecture active peut être très utile, et elle devrait être multilingue. Comme il y a beaucoup de "cognats" (quasi-synonymes ou faux amis) entre ces langues, à l'écrit ou à l'oral, à cause de liens étymologiques ou d'emprunts, nous proposons d'aider les apprenants dans leur apprentissage lexical en leur montrant les cognats des mots du texte qu'ils lisent, arrivant ainsi à un outil de lecture active étymologique (LAEtymo). Nous avons recensé les aides apportables dans une dizaine de situations précises, et spécifié une extension de l'interface du CESSELIN/LECTURE (dédié au japonais-français) pour montrer les équivalents lexicaux dans 1 à 4 langages cibles, et pour intégrer l'aspect "étymologique" de façon qu'il constitue une aide significative. À partir de l'outil CESSELIN/LECTURE, nous avons produit une simulation de cette interface, avec en source le berbère et en cible le français, le berbère, l'arabe et l'arabe dialectal algérien. Comme il s'agit de couples de langues peu dotés, notre premier problème est de collecter ou constituer les ressources nécessaires, à savoir un grand ensemble de cognats entre ces langues, une base lexicale utilisable pour chaque couple de langues, et un lemmatiseur pour chaque langue. Dans le cas du berbère, nous sommes en train de collecter des dictionnaires et de les mettre sur la plate-forme JIBIKI, ainsi que des corpus monolingues en tamazight (écrits en tifinagh ou tamamritrit-latin), le tout en format XML et en encodage UTF-8.
Fichier principal
Vignette du fichier
TALAf2018_SAVBMMCB.pdf (1.42 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-02054881 , version 1 (02-03-2019)

Identifiants

  • HAL Id : hal-02054881 , version 1

Citer

Slimane Abdellaoui, Valérie Bellynck, Mathieu Mangeot, Christian Boitet. Outillage de l'accès aux textes par la lecture active étymologique multilingue pour apprenants berbérophones et arabophones. Traitement Automatique des Langues Africaines TALAf 2018, Sep 2018, Grenoble, France. ⟨hal-02054881⟩
99 Consultations
78 Téléchargements

Partager

Gmail Facebook X LinkedIn More