, Celui-ci permet d'utiliser un langage d'expressions régulières pour établir des requêtes complexes. Par exemple, la requête "intére(t|ss)(e|é) (r|e)?s?" obtiendra les mots intérêt, intérêts, intéressé, intéresser, intéressée, intéressées. Il est également possible de combiner les niveaux d'annotations. Par exemple, la requête, Le module de consultation des corpus bilingues alignés français-japonais est programmé en perl à l'aide de la plate-forme IMS Open Corpus Workbench 13 et de son outil de consultation Corpus Query Processor (CQP)

, Les données proviennent d'une part du projet OPUS 15 pour les logiciels

, Coran et les sous-titres de films (OpenSubtitles) et d'autres part de corpus que nous avons constitué nous-mêmes avec des textes trouvés sur le Web (Le Monde Diplomatique, la Bible, une convention fiscale franco-japonaise et la déclaration universelle des droits de l'Homme)

, Le furigana a été ajouté au texte japonais, ce qui permet d'effectuer des recherches au niveau de la lecture des kanji. Par exemple, Ces données, alignées au niveau du paragraphe, ont été ensuite étiquetées pour le français en utilisant Tree tagger (voir 4.11) et pour le japonais en utilisant Mecab

, La figure 11 montre le résultat de la recherche du mot japonais « ? ? » (haichi) dans le corpus du Monde Diplomatique. Le corpus étant parallèle, il est également possible de rechercher des mots français

, la totalité des corpus atteint environ 6 millions de mots dont : ? Journaux : Le Monde Diplomatique

. Textes, Convention fiscale franco-japonaise (17 443 mots) et Déclaration universelle des droits de l'Homme

?. Logiciels, KDE 4 ( 1,179 millions de mots) et OpenOffice 3 (569 903 mots)

, ? Textes religieux : la Bible (904 914 mots) et le Coran (Tanzil) (192 905 mots)

, Sous-titres de films (OpenSubtitles) (4,714 millions de mots)

, Cet éditeur est programmé à l'aide de la technologie AJAX 18

, Celle-ci se compose d'un formulaire HTML avec interacteurs classiques pour les différents types de données (champ texte pour du texte libre, menu déroulant pour des listes fermées de valeurs, cases à cocher pour des booléens, boutons radio pour des choix de valeur, etc.) ainsi que des interacteurs élaborés pour gérer les listes d'objets (par exemple, L'interface d'édition complète est générée automatiquement à partir de la structure des articles notées sous forme de schéma XML 20 (Mangeot & Thevenin, 2004.

, L'utilisateur peut ensuite éditer l'article concerné. À la fin de son travail, il prévisualise ses changements. Il peut ensuite soit sauvegarder temporairement ses modifications en leur affectant un statut « brouillon », soit annuler ses modifications, soit les enregistrer ceux-ci, ? 82 663 articles proviennent du dictionnaire Cesselin dont : ? 10 243 articles (12,39 %) dont les mots-vedette en kanji sont « ??, Pour accéder à l'édition complète, il suffit de cliquer sur le lien « Édition » du menu en haut à droite de chaque article

, 70 %) dont les mots-vedette n'ont pas encore été vérifiés (automatiquement ou manuellement), ?, vol.40, issue.48, p.259

, ? 23 512 articles proviennent des liens entre pages Wikipedia. Figure 17 : Formulaire d'édition complète pour les exemples de l'article « ??

, Sur les 153 897 articles, on en trouve 47 813 articles (31,07 %) dont les traductions sont en anglais

, Après 3 mois de fréquentation, au 25 octobre 2015, le site a enregistré 2 639 modifications d'articles dont : ? 86 mots-vedette en kanji ajoutés, ? 225 mots-vedette en kanji vérifiés

, La constitution de cette ressource constitue un point de départ pour des recherches futures

, Concernant la production de données, nous prévoyons de lancer un processus identique pour récupérer un dictionnaire français?japonais. Nous envisageons également d'enrichir la ressource actuelle en y ajoutant de nouvelles informations (compteurs, quantificateurs

. Mangeot, Concernant l'exploitation de données, l'obtention d'une ressource français?japonais permettra d'expérimenter la convergence vers une macrostructure pivot, 2004.

, Ce projet a été réalisé grâce au programme Hosei International Fund (HIF) qui nous a permis d'être accueilli à l'Université Hosei, 2014.

U. Apel, WaDokuJT -A Japanese-German Dictionary Database, NII, vol.13, 2002.

V. Berment, Me?thodes pour informatiser des langues et des groupes de langues "peu dote?es, vol.277, 2004.

J. W. Breen, JMDict: a Japanese-multilingual dictionary, Coling 2004 workshop on multilingual linguistic resources, pp.71-78, 2004.

G. Cesselin, Dictionnaire japonais-français, 1940.

J. Desperrier, Analyze [sic] of the results of a collaborative project for the creation of a Japanese-French dictionary, Proceedings of Papillon, 2002.

. Edr, EDR Electronic Dictionary Technical Guide, vol.144, 1993.

E. Ch and M. Mangeot, LMF: Lexical Markup Framework, theory and practice, Hermès science, vol.17, 2013.

E. Ch and M. Mangeot, Computerization of African languages-French dictionaries, Proc. of Collaboration and Computing for Under Resourced Languages in the Linked Open Data Era (CCURL), LREC 2014 workshop, vol.8, 2014.

G. Francopoulo, N. Bel, M. George, N. Calzolari, M. Monachini et al., Multilingual resources for NLP in the Lexical Markup Framework (LMF), Language Resources and Evaluation, vol.43, pp.57-70, 2009.

G. Pascal, Plus de « cent cinquante ans » d'histoire de l'enseignement du japonais. Le japonais au XXIe siècle -Actes des États généraux pour l, pp.47-63, 2008.

Y. Gut, R. Puteri, R. Megat, Y. Zaharin, K. Chuah-choy et al., Kamus Perancis-Melayu Dewan, dictionnaire français-malais, vol.667, 1996.

K. Hisamatsu, Y. Obataya, and F. Hayakawa, Dictionnaire Japonais-Français / Français-Japonais, 1280.

K. Hirao, La re?novation du dictionnaire français-japonais dans les anne?es 1980 : le Dictionnaire ge?ne?ral français-japonais de Hakusuisha et le Shogakukan Robert Grand Dictionnaire français-japonais dans Heinz, Michaela (éd.), Cultures et lexicographies, pp.103-111, 2010.

M. Mangeot, Environnements centralise?s et distribue?s pour lexicographes et lexicologues en contexte multilingue, vol.280, 2001.

M. Mangeot, Acquiring and Representing Multilingual, Specialized Lexicons : the Case of Biomedicine, LREC workshop, 2006.

M. Mangeot, Mota?Mot project: conversion of a French-Khmer published dictionary for building a multilingual lexical system, Proc. of LREC, vol.8, 2014.

M. Mangeot, Construction of an open-source multilingual lexical system targeted on French and Japanese through contributive and automatic methods, vol.12, 2015.
URL : https://hal.archives-ouvertes.fr/hal-01294562

M. Mangeot and A. Chalvin, Dictionary building with the Jibiki platform : the GDEF case, LREC 2006, pp.1666-1669, 2006.
URL : https://hal.archives-ouvertes.fr/hal-00968611

M. Mangeot, G. Sérasset, and M. Lafourcade, Construction collaborative d'une base lexicale multilingue, Traitement Automatique des Langues, vol.44, issue.2, pp.151-176, 2004.
URL : https://hal.archives-ouvertes.fr/hal-00340723

M. Mangeot and D. Thevenin, Online Generic Editing of Heterogeneous Dictionary Entries in Papillon Project, Proc. of COLING, pp.1029-1035, 2004.
URL : https://hal.archives-ouvertes.fr/hal-00968639

A. Matsumura, Daijirin Japanese-English dictionary ( ???), pp.2974-2978, 2006.

I. Mel'?uk, A. Clas, A. ;. Polguère, . Aupelf-uref, and . Duculot, Introduction a? la lexicologie explicative et combinatoire. Universités francophones et champs linguistiques, vol.256, 1995.

A. Polguère, Lexicologie et se?mantique lexicale. Notions fondamentales. Paramètres, 304 pages. Les Presses de l, 2008.

É. Raguet and J. Martin, Dictionnaire français-japonais, 1467.