%0 Conference Proceedings %T Co-clustering de données textuelles et continues %+ Entrepôts, Représentation et Ingénierie des Connaissances (ERIC) %+ Université de Lille, Sciences et Technologies %+ MOdel for Data Analysis and Learning (MODAL) %A Selosse, Margot %A Jacques, Julien %A Biernacki, Christophe %< avec comité de lecture %B SFdS 2018 - 50èmes Journées de Statistique %C Saclay, France %8 2018-05-28 %D 2018 %K Co-clustering %K données hétérogènes %K modèle des blocs latents %Z Mathematics [math]/Statistics [math.ST]Conference papers %X Le clustering est un outil essentiel pour l’analyse de données. C’est unemanière de résumer un jeu de données en formant des groupes homogènes d’observations(les clusters). Cependant, le phénomène «big-data »a fait croître le nombre de variables,conduisant à l’émergence de jeux de données de grande dimension, parfois à un niveautel que les techniques de clustering ne sont plus toujours adaptées pour discerner desstructures. En effet, l’analyse d’un cluster repose généralement sur un représentant de cecluster (par exemple la moyenne). Néanmoins, ce dernier est lui-même décrit par un grandnombre de variables, ce qui rend difficile l’interprétation et hasardeuse l’estimation. Decette observation naît le besoin de «résumer »aussi les variables, ce que leur regroupementen clusters peut permettre, de façon symmétrique au regroupement classique des individusen clusters. Le co-clustering est alors une méthode candidate car elle réalise un clusteringsimultané des lignes et des colonnes. Dans le cas de l’analyse de données textuelles, etnotamment le clustering de document, le co-clustering est un thème largement étudiélors de ces dernières années. Cependant, la plupart des approches ne permettent pas deprendre en compte, en plus des données textuelles, d’autres variables. Le travail présentépropose une extension du modèle des blocs latents pour des jeux de données avec desvariables textuelles et continues. %G French %2 https://inria.hal.science/hal-01797493/document %2 https://inria.hal.science/hal-01797493/file/sfds.pdf %L hal-01797493 %U https://inria.hal.science/hal-01797493 %~ CNRS %~ INRIA %~ UNIV-LYON1 %~ UNIV-LYON2 %~ INRIA-LILLE %~ INSMI %~ ERIC %~ INRIA_TEST %~ LORIA2 %~ TESTALAIN1 %~ INRIA2 %~ LABEXIMU %~ UNIV-LILLE %~ LYON2 %~ UDL %~ UNIV-LYON %~ LPP-MATH