Présentation de l’équipe

Les ambitions affichées conjointement par l’Ingénierie des Connaissances et la Fouille de Données
sont en partie empiriques : elles visent l’efficience dans un environnement régulé par des usages
et des pratiques. Par conséquent, une part des travaux est intimement liée aux applications. Nous
développons depuis plusieurs années des relations interdisciplinaires étroites dans deux champs
disciplinaires : en Sciences Economiques et Management et en Sciences de la Vie.

Axes de recherche

Ingénierie des ontologies
Nos travaux portent sur la représentation conceptuelle des connaissances par des ontologies, et
sur leur opérationnalisation dans des Systèmes à Base de Connaissances. Trois problématiques
principales sont ainsi abordées :
  • la construction au sens de leur représentation formelle : nous étudions en particulier l’apport des
    modèles de graphes conceptuels et l’expressivité des langages du Web sémantique (e.g. RDF/s,
    OWL) ;
  • l’alignement au sens de l’interopérabilité sémantique : nos travaux portent sur les ontologies
    lourdes qui intègrent la sémantique du domaine sous forme d’axiomes, et sur les taxonomies
    associées ou non à des corpus textuels ;
  • l’intégration des ontologies au sein de Systèmes à Base de Connaissances : nous nous
    intéressons en particulier à l’acquisition des connaissances et à leur modélisation via des modèles
    graphiques interactifs adaptés. Les ontologies considérées sont des ontologies de domaine, des
    ontologies de représentation et des ontologies de PSM (Problem-Solving Method).
Fouille de données complexes
    Tout en incorporant l’intégration des connaissances externes et la dimensionnalité des données,
    la terminologie "données complexes" recouvre dans son usage le plus courant des données de
    nature différente (texte, image, vidéo, ...). Nous l’utilisons dans une acceptation plus spécifique ;
    nous nous intéressons dans le cadre du "post-mining" aux données qui sont des résultats
    volumineux d’algorithmes automatiques, et aux données intégrant des structures relationnelles
    modélisables par des graphes.
  • le post-mining de règles d’association.
    Les règles d’association ont été un des concepts les plus utilisés de la dernière décennie pour
    exprimer simplement des tendances implicatives de type A --> B entre des sous-ensembles
    d’attributs. Il est maintenant bien connu que les algorithmes d’extraction engendrent des
    ensembles de règles trop volumineux pour une analyse in extenso de l’utilisateur. Nous abordons
    ce problème par deux approches complémentaires : le filtrage des règles pour restreindre les
    résultats aux règles les plus pertinentes ; la structuration des ensembles de règles pour une
    représentation synthétique mettant en évidence les principales relations.
  • la classification de structures relationnelles.
    Trouvant principalement leur motivation applicative dans des travaux sur la Toile, la majorité des
    travaux actuels en "Link Analysis" considèrent comme données un très grand réseau de relations
    et cherchent à en extraire les caractéristiques. Nous nous intéressons à un problème connexe :
    l’analyse, non plus d’un grand graphe unique, mais d’un corpus de graphes. Il s’agit alors de
    construire, dans un cadre non supervisé, des classifications qui intègrent à la fois des propriétés
    combinatoires, des propriétés sémantiques -ou fonctionnelles- et parfois aussi des propriétés
    topologiques lorsque les graphes sont plongés dans des espaces géométriques.
  • L’intégration des préférences
    L’objectif général est d’intégrer l’utilisateur dans la ’’boucle de découverte’’ afin de combiner les
    potentialités humaines de jugement avec les capacités de calcul des machines. Nous abordons
    cette vaste problématique selon deux optiques : la mise au point de modèles développés dans le
    cadre de l’Aide Multicritère à la Décision qui représentent numériquement des préférences à un
    utilisateur ; le pilotage des algorithmes par l’utilisateur -qui joue alors le rôle d’une heuristique- via
    des interfaces visuelles interactives adaptées.
    • Aide Multicritère à la Décision.
      Cette approche vise à prendre en compte simultanément différents points de vue. Notre démarche
      se place dans le cadre des méthodes d’utilité multiattribut : chaque alternative est synthétisée en
      un score global par agrégation des différents points de vue, et le choix d’une alternative se déduit
      d’une comparaison des scores. Un des intérêts majeurs de cette approche est de pouvoir
      représenter une grande variété de stratégies grâce à l’étendue des fonctions d’aggrégation. Nos
      travaux portent en particulier sur l’analyse de ces fonctions.
    • Visualisation interactive.
      Cette approche vise à intégrer la part subjective de l’utilisateur difficile à verbaliser préalablement.
      Lorsqu’il dispose d’un système interactif, la démarche de l’utilisateur peut être associée à une
      stratégie de navigation dans un environnement complexe, qui se situe dans un continuum entre la
      requête (but précis et bien défini) et le butinage (besoin mal exprimé initialement qui le conduit à
      poursuivre sa recherche jusqu’à une certaine satisfaction). Dans le cadre de la fouille de règles
      d’association, nous nous intéressons aux représentations formelles permettant de définir l’espace
      de navigation ; aux représentations visuelles associées (graphes, métaphores graphiques) ; et à
      l’implémentation interactive d’un processus de fouille.