Probabilité d'apparition d'un phénomène parasitaire et choix de modèles de régression logistique - Archive ouverte HAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2008

Probabilité d'apparition d'un phénomène parasitaire et choix de modèles de régression logistique

Résumé

Epidemiological processes are now using spatial statistics and modelling tools. The main objective of most health risks studies consists in identifying potential contamination sources and factors capable of explaining their localization. Health data often prove binary (typically presence/absence) and specific methods such as binary logistic regression have to be used. This method's output consists in a probability for the pathogen of interest. A posterior classification of each sample is then conducted using a probability threshold. The method used to maximize this threshold is called the ROC curve which consists in giving a representation of the behaviour of the model and then to choose the optimal value to discriminate between negative and positive predictions. Using a point data epidemiological base, several models were generated and tested. Landscape indices have been derived in the environment of the points at three scale levels. Probability values allocated to each sample were then spatially represented, giving an insight on the expected geographical dispersion of contaminated samples. Variables identified in the models were then used to establish hypothesis as to which landscape factors might play a role in epidemiological processes. The outlining of potential high risk areas is a result of first importance in the geography of health.
Les processus épidémiologiques sont de plus en plus fréquemment abordés à l'aide des outils de la statistique spatiale et de la modélisation. Ces travaux ont généralement pour but de mettre en évidence des foyers de contamination et d'identifier des variables pouvant expliquer leur présence. Le caractère binaire des données sanitaires nécessite la mise en oeuvre de méthodes spécifiques comme la régression logistique binaire, qui permet d'attribuer à chaque échantillon une probabilité de présence de l'agent pathogène d'intérêt. La classification postérieure de chaque échantillon nécessite le choix d'un seuil de probabilité pour définir le caractère à risque ou sans risque des observations. La méthode ROC permet de définir ce seuil et de comprendre précisément les conséquences de ce choix. À partir d'une base de données épidémiologique ponctuelle, plusieurs modèles ont été générés et testés. Des indices paysagers ont été dérivés dans l'environnement des points à trois échelles d'analyse. Les probabilités attribuées à chaque échantillon par les modèles ont été représentées spatialement ce qui donne un outil d'interprétation de la répartition attendue des échantillons contaminés. Les variables identifiées à ces trois niveaux d'échelle ont conduit à ébaucher des hypothèses quant aux facteurs paysagers qui entrent en jeu dans les processus épidémiologiques. L'apparition de foyers de risque potentiel constitue un premier résultat.
Fichier principal
Vignette du fichier
Tolle_TQ2007_ARTICLE_17.pdf (883.48 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-00762437 , version 1 (29-09-2013)

Identifiants

  • HAL Id : hal-00762437 , version 1

Citer

Florian Tolle, François-Pierre Tourneux. Probabilité d'apparition d'un phénomène parasitaire et choix de modèles de régression logistique. Huitièmes rencontres de Théo Quant, Jan 2007, Besançon, France. http://thema.univ-fcomte.fr/theoq/pdf/2007/TQ2007%20ARTICLE%2017.pdf. ⟨hal-00762437⟩
120 Consultations
162 Téléchargements

Partager

Gmail Facebook X LinkedIn More