Batelòc : cap a una basa informatisada de tèxtes occitans - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2011

Batelòc : cap a una basa informatisada de tèxtes occitans

Myriam Bras
  • Fonction : Auteur
  • PersonId : 1046948
Jean Thomas
  • Fonction : Auteur
  • PersonId : 953936

Résumé

Per mai d'un cercaire dins lo domeni occitan, que siá linguista, literari, istorian, etnològ, sociològ, lo trabalh de recèrca passa per l'estudi de tèxtes en lenga occitana. Pels cercaires medievistas, lo Concordancièr de l'Occitan Medieval, permet de far de cèrcas eficaças e aviadas. Pels autres, i a de segur los libres e manescriches de papièr. I a tanben las fotografias electronicas (al format pdf) d'una bona tièra d'òbras, mesas a posita per CIEL d'ÒC dins la bibliotèca virtuala de la Tor Manha. Lo projècte nòstre es de bastir una basa informatizada de tèxtes en lenga occitana. La tòca es de recampar dins aquela basa --nomenada Basa Telòc (Batelòc)-- de tèxtes escriches, de totas menas e tanben d'oral-escrich. Batelòc e sas aisinas d'interrogacion permetràn a cada cercaire de causir son còrpus de trabalh en combinant de critèris coma lo nom de l'autor, lo titol de l'òbra, la temporada, la data, lo genre textual, lo dialècte de l'occitan, la nòrma grafica. I poiràn puèi far de requèstas coma cercar de concordanças, traire de contèxtes que clauson una forma (un mot-grafic), una partida o una sequéncia de formas ; cercar de coocurréncias, o calcular de frequéncias. Quand la basa serà pro larga, un tractament linguistic per etiquetar las formas graficas amb d'informacions morfosintacticas per ne far una basa lematizada e categorizada, permetrà de far de requèstas mai complèxas. Aquel projècte es menat dins l'encastre d'una Unitat Mixta de Recèrca (Universitat de Tolosa lo Miralh e CNRS) en linguistica, competenta en tractament automatic de las lengas. Se fa en partenariat amb CIEL d'ÒC, IDECO/IEO, lo CROM, l'ATILF -- lo laboratòri que manten la basa Frantext-- e lo Centre National de Ressources Textuelles et Lexicales que metrà la basa a posita del public sus son portanèl dedicat a las ressorgas lexicalas e textualas.

Domaines

Linguistique
Fichier principal
Vignette du fichier
Art_AIEO08_Bras_Thomas.pdf (695.92 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-00986409 , version 1 (02-05-2014)

Identifiants

  • HAL Id : hal-00986409 , version 1

Citer

Myriam Bras, Jean Thomas. Batelòc : cap a una basa informatisada de tèxtes occitans. IXème Congrès International de l'Association Internationale d'Études Occitanes, Aug 2008, Aachen, Germany. pp.661-670. ⟨hal-00986409⟩
152 Consultations
1396 Téléchargements

Partager

Gmail Facebook X LinkedIn More