Méthodes à noyaux appliquées aux textes structurés: Rapport d'avancement 1

Sujeevan Aseervatham; Emmanuel Viennet

Communication Dans Un Congrès Année : 2006

Méthodes à noyaux appliquées aux textes structurés: Rapport d'avancement 1

(1) , (1)

Sujeevan Aseervatham

Fonction : Auteur
PersonId : 737904
IdHAL : sujeevan-aseervatham
ORCID : 0000-0001-8406-7795

Laboratoire d'Informatique de Paris-Nord

Emmanuel Viennet

Fonction : Auteur
PersonId : 829640

Laboratoire d'Informatique de Paris-Nord

Résumé

De nombreuses techniques d'apprentissage numérique appliquées au traitement de données textuelles utilisent une représentation du texte en "sac de mot". Ce codage, qui a l'avantage de la simplicité, n'utilise que les fréquences d'apparition des mots dans les documents et perd toute information liée à l'ordre des éléments (ordre des mots, structure en paragraphes ou sections, etc). Depuis une petite dizaine d'années, une nouvelle famille d'algorithme d'apprentissage, basée sur la notion de noyaux, fait l'objet d'intenses recherches. Ces noyaux permettent de définir des mesures de similarité utilisables dans de nombreux algorithmes d'apprentissage statistique (de l'analyse discriminante de Fisher aux machines à vecteur de support). Récemment, l'utilisation de noyaux spécifiques pour le traitement de données textuelles structurées a commencé à faire l'objet de recherches. Dans le cadre de la sous-tâche 3.12 du projet InfoM@gic, le LIPN a décidé de travailler sur l'application de ces méthodes à noyau au traitement de données textuelles structurées. Ce rapport intermédiaire présente un bref état de l'art dans ce domaine. Nous passons en revue les principaux types de noyaux proposés ces dernières années pour le traitement des séquences et plus généralement des données structurées (arbres, graphes).

Mots clés

Méthodes à noyaux données structurées texte tal

Domaines

Apprentissage [cs.LG]

Fichier principal

kernelStruct.pdf (194.8 Ko)

Origine : Fichiers produits par l'(les) auteur(s)

Sujeevan Aseervatham : Connectez-vous pour contacter le contributeur

https://hal.science/hal-00153983

Soumis le : mardi 12 juin 2007-14:42:20

Dernière modification le : vendredi 24 mars 2023-14:52:49

Archivage à long terme le : jeudi 8 avril 2010-17:30:36

Dates et versions

hal-00153983 , version 1 (12-06-2007)

Identifiants

HAL Id : hal-00153983 , version 1

Citer

Sujeevan Aseervatham, Emmanuel Viennet. Méthodes à noyaux appliquées aux textes structurés: Rapport d'avancement 1. Rapport technique pour InfoMagic (Cap Digital), 2006, France. pp.17. ⟨hal-00153983⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UNIV-PARIS13 CNRS LIPN GALILE SORBONNE-PARIS-NORD

95 Consultations

175 Téléchargements

Méthodes à noyaux appliquées aux textes structurés: Rapport d'avancement 1

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager