| HAL : hal-00401011, version 1 |
| Fiche détaillée | Récupérer au format |
|
|
| Traitement Automatique des Langues Naturelles, Avignon : France (2008) |
|
|
|
|
| Repérage de citations, classification des styles de discours rapporté et identification des constituants citationnels en écrits journalistiques |
|
|
| Fabien Poulard 1Thierry Waszak 2 |
|
|
| (09/06/2008) |
|
|
| Dans le contexte de la recherche de plagiat, le repérage de citations et de ses constituants est primordial puisqu'il peut amener à évaluer le caractère licite ou illicite d'une reprise (source citée ou non). Nous proposons ici une comparaison de méthodes automatiques pour le repérage de ces informations et rapportons une évaluation quantitative de celles-ci. Un corpus d'écrits journalistiques français a été manuellement annoté pour nous servir de base d'apprentissage et de test. |
|
|
|
|
|
|
|
|
|
|
| 1 : | Laboratoire d'Informatique de Nantes Atlantique (LINA) |
| CNRS : UMR6241 – Université de Nantes – Ecole des Mines de Nantes | |
| 2 : | Laboratoire Informatique d'Avignon (LIA) |
| Université d'Avignon | |
|
|
|
|
|
|
|
|
| Domaine | : | Informatique/Traitement du texte et du document |
|
|
| Liste des fichiers attachés à ce document : | |||||
|
|
|
| hal-00401011, version 1 | |
| http://hal.archives-ouvertes.fr/hal-00401011 | |
| oai:hal.archives-ouvertes.fr:hal-00401011 | |
| Contributeur : Fabien Poulard | |
| Soumis le : Jeudi 2 Juillet 2009, 11:53:24 | |
| Dernière modification le : Jeudi 2 Juillet 2009, 13:20:38 | |