, nous obtenons les résultats de la Figure 11. Là encore, des informations importantes sont présentes sur ces graphiques. Tout d'abord, rappelons que le seuil optimal identifié par l'indice de Youden est de 36

, Le graphique en haut à gauche (intitulé « ROC curve ») représente la courbe ROC que nous avions déjà obtenue précédemment

, Mais trois nouvelles informations sont désormais présentes. Tout d'abord, nous voyons où le seuil optimal se situe sur la courbe

, Le point représentant ce seuil optimal a pour abscisse 1-Sp, avec Sp=0, p.938

, Ce point a pour ordonnée Se, soit 0, p.821

L. Graphique, Figure 11.6] représente les valeurs de Se (en rouge) et de Sp (en bleu) en fonction de la valeur de BM2 (« Marker Name

, Moins ces deux distributions se recoupent, plus le test diagnostique est capable de bien discriminer les animaux malades des animaux sains. Le graphique [Figure 11.8] représente d'une autre façon la distribution de BM2 dans les deux sous-échantillons d'animaux malades et sains. Dans ces deux graphiques [Figure 11.7 & Figure 11.8], le seuil optimal est représenté par un trait en pointillés. Sur le graphique [Figure 11.8], avec un seuil de 36 (seuil optimal selon l'indice de Youden, cf, ] représente la distribution (lissée) de BM2 dans chacun des sous-échantillons des animaux malades (en rouge) et sains (en bleu)

, sans savoir quelle aire allait être significativement différente d'une autre (il s'agit ici d'une sorte de « pêche au degré de signification significatif »). Si, en vrai, les trois tests diagnostiques sont purement équivalents dans leur capacité à discriminer les animaux malades des animaux sains, il y a de bonnes chances pour que, dans l'échantillon, au moins un des trois tests statistiques comparant les tests diagnostiques deux à deux soit malgré tout significatif 9 . (Lors d'une situation de tests statistiques multiples, on dit que le risque d'erreur de 1 ère espèce ?=0,05 est sur-évalué (Dmitrienko and D'Agostino, 2013).) Une des méthodes pour réaliser ces tests statistiques multiples sans que le risque d'erreur de 1 ère espèce ? ne soit sur-évalué est celle de Bonferroni (Perneger, 1998), Figure 11. Copie d'écran de la page « Cut points » après avoir cliqué sur « Include plots ». cette situation de tests statistiques multiples car trois tests statistiques ont été utilisés : aire « BM2 » versus aire « BM1 », aire « BM2 » versus aire « BM3 », et aire « BM1 » versus aire « BM3 »

, Après correction, nous nous apercevons que l'aire sous la courbe ROC du test diagnostique BM2 n'est plus significativement différente de l'aire sous la courbe ROC du test diagnostique BM1. Ce résultat n'est pas contradictoire avec ce que nous avions trouvé avant d'ajouter « BM3 » dans la liste des variables quantitatives [Figure 14.1] : avant d'ajouter « BM3 », nous voulions répondre à la question suivante (et nous devions avoir une bonne raison de nous poser cette question) : « est-ce que les tests diagnostiques BM1 et BM2 sont réellement différents dans leur capacité à discriminer les animaux malades des animaux sains ? » En ajoutant « BM3 », là, nous sommes beaucoup plus dans une démarche exploratoire, avec la question sousjacente suivante : « quel est, des trois tests diagnostiques, celui qui se distingue des deux autres dans sa capacité à discriminer les animaux malades des animaux sains ?, nous obtenons les degrés de signification de la colonne « p-value (adj.) » qui sont corrigés par la correction de Bonferroni

D. G. Altman and J. M. Bland, Diagnostic tests 2: Predictive values, BMJ, vol.309, p.102, 1994.

R. Bender and S. Lange, Adjusting for multiple testing--when and how?, J Clin Epidemiol, vol.54, pp.343-352, 2001.

M. Davidson, The interpretation of diagnostic test: a primer for physiotherapists, Aust J Physiother, vol.48, pp.227-259, 2002.

H. Delacour, A. Servonnet, A. Perrot, J. F. Vigezzi, and J. M. Ramirez, , 2005.

, Ann Biol Clin (Paris), vol.63, pp.145-54

J. Detilleux, J. Arendt, F. Lomba, and P. Leroy, Methods for estimating areas under receiveroperating characteristic curves: illustration with somatic-cell scores in subclinical intramammary infections, Prev Vet Med, vol.41, pp.75-88, 1999.

A. Dmitrienko, R. Agostino, and . Sr, Traditional multiplicity adjustment methods in clinical trials, Stat Med, vol.32, pp.5172-218, 2013.

K. J. Drobatz, Measures of accuracy and performance of diagnostic tests, J Vet Cardiol, vol.11, issue.1, pp.33-40, 2009.

T. J. Fagan, Letter: Nomogram for Bayes theorem, N Engl J Med, vol.293, p.257, 1975.

, Cette probabilité vaut

. =-14%-de-chances,

D. Goksuluk, S. Korkmaz, G. Zararsiz, and A. E. Karaagaoglu, easyROC: An Interactive Web-tool for ROC Curve Analysis Using R Language Environment, The R Journal, vol.8, pp.213-230, 2016.

M. Greiner, D. Pfeiffer, and R. D. Smith, Principles and practical application of the receiveroperating characteristic analysis for diagnostic tests, Prev Vet Med, vol.45, pp.23-41, 2000.

D. A. Grimes and K. F. Schulz, Uses and abuses of screening tests, Lancet, vol.359, pp.881-885, 2002.

D. A. Grimes and K. F. Schulz, Refining clinical diagnosis with likelihood ratios, Lancet, vol.365, pp.1500-1505, 2005.

S. R. Hayden and M. D. Brown, Likelihood ratio: A powerful tool for incorporating the results of a diagnostic test into clinical decisionmaking, Ann Emerg Med, vol.33, pp.575-80, 1999.

M. Lopez-raton, M. X. Rodriguez-alvarez, C. Cadarso-suarez, and F. Gude-sampedro, OptimalCutpoints: An R Package for Selecting Optimal Cutpoints in Diagnostic Tests, J Stat Software, p.61, 2014.

L. B. Lusted, Decision-making studies in patient management, N Engl J Med, vol.284, pp.416-440, 1971.

N. J. Perkins and E. F. Schisterman, The inconsistency of "optimal" cutpoints obtained using two criteria based on the receiver operating characteristic curve, Am J Epidemiol, vol.163, pp.670-675, 2006.

T. V. Perneger, What's wrong with Bonferroni adjustments, BMJ, vol.316, pp.1236-1244, 1998.

E. F. Schisterman, N. J. Perkins, A. Liu, and H. Bondell, Optimal cut-point and its corresponding Youden Index to discriminate individuals using pooled blood samples, Epidemiology, vol.16, pp.73-81, 2005.

K. Soreide, Receiver-operating characteristic curve analysis in diagnostic, prognostic and predictive biomarker research, J Clin Pathol, vol.62, pp.1-5, 2009.

M. H. Sweig and G. Campbell, Receiver-Operating Characteristic (ROC) Plots: A Fundamental Evaluation Tool in Clinical Medicine, Clin Chem, vol.39, pp.561-77, 1993.

J. A. Swets, Measuring the accuracy of diagnostic systems, Science, vol.240, pp.1285-93, 1988.

E. Timsit, R. Leguillette, B. J. White, R. L. Larson, and S. Buczinski, Likelihood ratios: an intuitive tool for incorporating diagnostic test results into decision-making, J Am Vet Med Assoc, vol.252, pp.1362-1366, 2018.

W. J. Youden, Index for rating diagnostic tests, Cancer, vol.3, pp.32-37, 1950.