A method to enrich experimental datasets by means of numerical simulations in view of classification tasks - Archive ouverte HAL Accéder directement au contenu
Article Dans Une Revue ESAIM: Mathematical Modelling and Numerical Analysis Année : 2021

A method to enrich experimental datasets by means of numerical simulations in view of classification tasks

Résumé

Classification tasks are frequent in many applications in science and engineering. A wide variety of statistical learning methods exist to deal with these problems. However, in many industrial applications, the number of available samples to train and construct a classifier is scarce and this has an impact on the classifications performances. In this work, we consider the case in which some a priori information on the system is available in form of a mathematical model. In particular, a set of numerical simulations of the system can be integrated to the experimental dataset. The main question we address is how to integrate them systematically in order to improve the classification performances. The method proposed is based on Nearest Neighbours and on the notion of Hausdorff distance between sets. Some theoretical results and several numerical studies are proposed.
Les problèmes de classification sont fréquents dans de nombreuses applications de la science et de l'ingénierie. Une grande variété de méthodes d'apprentissages statistique existent pour répondrè a ces problématiques. Cependant, dans beaucoup d'applications industrielles, le nombre d'échantillons disponibles pour la base d'apprentissage et construire le classificateur est faible et impacte ainsi les preformances de classification. Dans ce travail, nous considérons le cas dans lequel nous avons un modèle mathématiques décrivant le système physique associé. En particulier, un ensemble de ces simulations du système peuventêtre intégréesà la base de données expérimentale. La principale question que nous abordons concerne l'intégration automatique de ces données dans le but d'améliorer les performances du classificateur. La méthode proposée utilise les plus proches voisins ainsi que la distance de Hausdorff entre ensembles. Des résultats théoriques et des exemples d'applications numériques sont montrés.
Fichier principal
Vignette du fichier
paper_m2an.pdf (6.29 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

hal-03377036 , version 1 (31-03-2021)
hal-03377036 , version 2 (27-09-2021)
hal-03377036 , version 3 (13-10-2021)

Identifiants

  • HAL Id : hal-03377036 , version 2

Citer

Damiano Lombardi, Fabien Raphel. A method to enrich experimental datasets by means of numerical simulations in view of classification tasks. ESAIM: Mathematical Modelling and Numerical Analysis, In press. ⟨hal-03377036v2⟩
312 Consultations
149 Téléchargements

Partager

Gmail Facebook X LinkedIn More