, mais aussi ont permis de comparer différents algorithmes de classification multi-labels sur la base PMSI afin au final identifié celui qui était le plus adapté. Après l'analyse des caractéristiques des données, il a été constaté que les jeux de données manipulés dans les expérimentations sont déséquilibrés. Après analyse du déséquilibre, l'algorithme ML_ROS a été appliqué avec différents pourcentages afin d'obtenir une meilleure prédiction. Le sur-échantillonnage a nettement amélioré les prédictions, L'étude de la classification multi-labels et les expérimentations que nous avons menées ont visé à mettre en évidence les caractéristiques des jeux de données manipulés

, Comme bilan de ce travail, nous concluons sur la pertinence du traitement du déséquilibre avec l'algorithme ML_ROS25 sur les 1100 jeux de données ainsi que l'efficacité de l'algorithme BRq pour la classification multi-labels appliqué à la base PMSI puisqu'il s'agit de l'algorithme qui présente les meilleurs résultats si l

, Comme perspectives à ce travail, nous envisageons d'intégrer dans le processus d'analyse prédictive mise en place d'autres sources de données telles que les images médicales ou les données textuelles de santé afin d'améliorer encore la prédiction des diagnostics secondaires pour un séjour patient

G. H%, , p.0

!. C. Koby, D. Mark, G. Kuzman, P. Partha-&-c, and . Steven, Automatic code assignment to medical text, Proceedings of the Workshop on Biological, Translational, and Clinical Language Processing, 2007.

!. F. Alsaby, Golay Code Classifier Approach for medical diagnosis, pp.1-6, 2016.

!. F. Herrera, F. Charte, A. J. Rivera, and M. J. Del-jesus, Multi-label Classification Problem Analysis. Metrics and Techniques, 2016.

!. F. Herrera, F. Harte, A. J. Rivera, and M. J. Del-jesus, Addressing Imbalance in multi-label classification : Measures and random resampling algorithms, Neurocomputing, vol.163, pp.925-2312, 2015.

!. G. Chahbandarian, N. Souf, I. Megdiche-bousarsar, R. Bastide, and J. C. Steinbach, Predicting the encoding of secondary diagnoses. An experience based on decision trees, 2017.

. Dans-/-in, Ingénierie des Systèmes d'Information, vol.22, pp.69-94

!. H. He and Y. Ma, Imbalanced Learning : Foundations, Algorithms, and Applications, pp.978-979, 2013.

!. H. Gouk and B. Pfahringer, Learning Distance Metric for multi-label classification, Workshop and Conference Proceedings, vol.63, pp.318-333, 2016.

!. S. Moturu, H. Liu, and W. G. Johnson, Understanding the Effects of Sampling on Healthcare Risk Modeling for the Prediction of Future High-Cost Patients, Biomedical Engineering Systems and Technologies. BIOSTEC, vol.25, 2008.

!. R. Miotto, F. Wang, S. Wang, X. Jiang, and J. T. Dudley, Deep learning for healthcare: review, opportunities and challenges. Brief Bioinform, 2017.

!. T. Grigorios-&-k and . Ioannis, Multi-Label Classification : An Overview, International Journal of Data Warehousing and Mining, vol.3, 2009.