Analyse de sensibilité fiabiliste en présence d'incertitudes épistémiques introduites par les données d'apprentissage

Gabriel Sarazin

Résumé

In many industrial fields, when a highly technical system is under study, reliability assessment requires resorting to a computationnally expensive simulation code which is used as a deterministic performance function. From a given set of input physical parameters, the associated output indicates whether failure has occured or not. Inputs are affected by aleatory uncertainty due to natural variability and their random simultaneous behavior is modeled by a multivariate probability distribution. The failure probability is then defined as the risk of exceeding an extreme threshold of the output distribution and it may be estimated with a wide range of reliability algorithms. The research work conducted in this thesis comes within a broader framework because the input distribution is unknown. It can only be appreciated through a small amount of data and it must be estimatedwith inferential statistics. In order to secure accurate reliability assessment, it is now generally agreed that the dependence structure among input variables must be dealt with through the copula-marginal separation. In this situation, the estimated failure probability directly derives from the provided dataset and is therefore impacted by sampling variability. In the literature, this second level of uncertainty is referred to as epistemic and it has mainly been studied in the context of parametric models supplemented with Bayesian prior knowledge. The main objective of this thesis is to develop a global sensitivity analysis approach in order to identify which entity of the input distribution conveys the largest share of epistemic uncertainty during reliability analysis. Such an answer may be a valuable piece of information because collecting additional data only for the targeted entity may offer a convenient way of mitigating variability in reliability assessment. The first contribution is a sensitivity analysis procedure designed to apportion epistemic uncertainty between the estimated copula distribution and the estimated marginal distributions. Addressing this problem is not an easy task because uncertainty originates from the split of a correlated dataset. Following the first sensitivity analysis, if the copula is appointed to be the most influential component of the input distribution, the state of knowledge about the theoretical input distribution can barely be improved. Since most multivariate copula models incorporate pair-copulas as efficient building blocks, the idea is to look for the most influential estimated pair-copula. The main difficulty lies in the fact that no systematic decomposition allows to rewrite the copula distribution in terms of all pair-copulas. As a second contribution, a sensitivity analysis procedure is put forward where each pair-copula is summarized by its Kendall’s rank correlation coefficient. Finally, the two reliability-oriented sensitivity analysis procedures are applied to the buckling of a composite plate.

Dans de nombreux domaines industriels, l’évaluation de la fiabilité d’un système complexe nécessite l’utilisation d’un code de simulation très coûteux en temps de calcul que l’on peut appréhender comme une fonction de performance déterministe. À partir d’un ensemble de paramètres d’entrée, la sortie du code indique si le système est défaillant. De par leur variabilité naturelle, les entrées sont entachées d’incertitudes aléatoires et leur comportement simultané est décrit par une distribution de probabilité multidimensionnelle. La probabilité de défaillance quantifie alors le risque de dépassement d’un seuil extrême en sortie et elle peut être estimée grâce à un algorithme de fiabilité. Les travaux conduits dans cette thèse s’inscrivent dans un cadre plus large où la distribution d’entrée est inconnue. Le seul matériel disponible est un petit échantillon d’observations conjointes à partir duquel la loi d’entrée peut être estimée via un algorithme d’apprentissage statistique. Afin de garantir la précision de l’estimation de la probabilité de défaillance, il est désormais communément admis qu’il faut capturer la structure de dépendance entre les variables d’entrée en s’appuyant sur la séparation copule-marginales. Dans cette situation, la prédiction fiabiliste découle directement des données fournies et elle est donc impactée par la variabilité d’échantillonnage. Dans la littérature, ce second niveau d’incertitude est qualifié d’épistémique et il est principalement étudié dans le cadre de distributions paramétriques en adoptant le point de vue bayésien. Le principal objectif de ce travail est la construction d’une démarche d’analyse de sensibilité globale permettant d’identifier la composante fonctionnelle de la distribution d’entrée qui engendre le plus de variabilité aumoment de son estimation. La réponse à ce problème est très utile si on cherche à réduire la variabilité de la prédiction fiabiliste car elle permet de se focaliser uniquement sur la recherche de données supplémentaires pour la composante ciblée. La première contribution est une procédure d’analyse de sensibilité visant à séparer les incertitudes issues de l’estimation de la densité de copule et celles issues de l’estimation des densités marginales. Pour cela, il faut être capable de caractériser la variabilité d’échantillonnage à partir d’un unique jeu de données. À la suite de cette première analyse, si la copule est identifiée comme la composante la plus influente, il est assez difficile d’envisager une amélioration de l’état de connaissance de la loi d’entrée. Comme la plupart des modèles de copules conçus pour la montée en dimension s’articulent autour d’un assemblage de copules bidimensionnelles, il est naturel de chercher la copule bidimensionnelle dont l’estimation est la plus influente sur la prédiction fiabiliste. La principale difficulté réside dans le fait qu’il n’existe aucune décomposition systématique permettant de réécrire une copule en fonction de toutes ses copules bidimensionnelles. La seconde contribution est une procédure d’analyse de sensibilité dans laquelle l’incertitude de chaque copule bidimensionnelle est résumée par celle de son coefficient de corrélation de Kendall. Enfin, les deux procédures d’analyse de sensibilité fiabiliste sont appliquées au flambage d’une plaque composite.

Reliability-oriented sensitivity analysis in presence of data-driven epistemic uncertainty

Analyse de sensibilité fiabiliste en présence d'incertitudes épistémiques introduites par les données d'apprentissage

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager