Use of metaheuristics for machine learning in the context of ALS - Archive ouverte HAL Accéder directement au contenu
Poster De Conférence Année : 2022

Use of metaheuristics for machine learning in the context of ALS

Utilisation de métaheuristiques pour de l'apprentissage automatique dans le cadre de la SLA

Résumé

For some time now, we have been working on learning algorithms to help with the prognosis of ALS patients. These learning methods are confronted with various problems, in particular that of data size (the number of features) versus the number of data available and usable data. The risk then is overfitting, leading to recommendation models that generalise poorly to a real population. One of the solutions adopted is to reduce the dimensionality of the data. Dimension reduction is characterised by the projection of data described in N dimensions into a reduced space of of dimension K < N. The main goal is to preserve the initial profile of the data by proposing a more relevant and compact representation. There are several approaches to dimension reduction: feature selection, which consists of retaining only a subset of the initial features, or feature extraction, which consists of extracting features from the initial features. keeping only a subset of the initial features, or feature extraction, which is based on a global is based on a global transformation of the data using an application that induces a coordinate change. Confronted with this problem of high dimensionality in previous work on ALS, we have developed a robust method based on manual selection of patient characteristics followed by a dimension reduction phase using the UMAP method. We propose here a significant improvement of this approach by including a preliminary phase of automatic dimension reduction phase based on meta heuristics from the field of operational research. This approach, combined with machine learning, makes it possible to obtain an almost optimal feature subset of initial data from cohorts of patients with ALS patients, making it possible to build a simple, high-performance mathematical prediction model. prediction model. Our methodology could thus contribute to individual prognosis, advance care planning and stratification. stratification in clinical trials.
Nous travaillons depuis quelques temps sur des algorithmes d’apprentissage pour aider au pronostic de survie de patients atteints de SLA. Ces méthodes d’apprentissage sont confrontées à divers problèmes, notamment celui de la dimension des données (le nombre de caractéristiques) versus le nombre de données disponibles et utilisables. Le risque est alors un sur-apprentissage conduisant à des modèles de recommandations qui généralisent mal sur une population réelle. Une des solutions adoptées consiste à réduire la dimensionnalité des données. La réduction de dimension se caractérise par la projection de données décrites en N dimensions vers un espace réduit de dimension K < N. L'objectif principal est de préserver le profil initial des données en proposant une représentation plus pertinente et plus compacte. Plusieurs approches existent pour réduire la dimension : la sélection de caractéristiques qui consiste à ne garder qu'un sous-ensemble des caractéristiques initiales ou l'extraction de caractéristiques qui repose sur une transformation globale des données grâce à une application qui induit un changement de coordonnées. Confrontés à ce problème de haute dimensionnalité dans des travaux antérieurs sur la SLA nous avons développé une méthode robuste basée sur une sélection manuelle des caractéristiques des patients suivie d'une phase de réduction de dimension par la méthode UMAP. Nous proposons ici une amélioration significative de cette approche en incluant une phase préalable de réduction automatique de dimension basée sur des méta heuristiques issues du domaine de la recherche opérationnelle. Cette approche, associée à l'apprentissage automatique permet d’obtenir un sous ensemble presqu’optimal de caractéristiques de données initiales de cohortes de patients atteints de la SLA permettant de construire un modèle mathématique de prédiction simple et performant. Notre méthodologie pourrait ainsi contribuer au pronostic individuel, à la planification préalable des soins et à la stratification dans les essais cliniques.
Fichier principal
Vignette du fichier
Poster_SLA_ANANI__Anglais_ (1).pdf (157.87 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-04246306 , version 1 (17-10-2023)

Identifiants

  • HAL Id : hal-04246306 , version 1

Citer

Thibault Anani, Jean-François Pradat-Peyre, Francois Delbot, Pierre-François Pradat. Use of metaheuristics for machine learning in the context of ALS. 8th ALS and MND research meeting, Oct 2022, Paris, France. ⟨hal-04246306⟩
25 Consultations
7 Téléchargements

Partager

Gmail Facebook X LinkedIn More