Statistique théorique et appliquée - Tome 2

 
Utilisation de R pour les exemples 5.4.1, 5.4.2 et 5.4.4 (édition 1998)

Exemple 5.4.1
Exemple 5.4.2
Exemple 5.4.4

par Emmanuel Nowak

 

Exemple 5.4.1. Comparaison de la sensibilité de deux races bovines à la trypanosomiase :
test de Fisher

Le but est de comparer la sensibilité de deux races à une maladie donnée : la trypanosomiase. Les bêtes infectées et non infectées ont été dénombrées dans chacun des deux groupes, à l'issue d'une même période d'élevage.

Pour un test bilatéral, le logiciel R utilise une autre méthode que celle présentée dans le livre. Il permet de calculer les probabilités d'occurrence, quand l'hypothèse nulle est vraie, des différentes répartitions possibles, et de sommer toutes celles qui sont inférieures ou égales à la probabilité de la répartition réellement observée :

tableau <- matrix(c(14,0,5,31),ncol=2)
fisher.test(tableau)$p.value

[1] 1.239863e-08

Le degré de signification pour un test bilatéral vaut donc exactement p = 0,000000012 à comparer à α = 0,05. Cette valeur de p est la même que pour le test unilatéral du fait de la dissymétrie de la loi hypergéométrique utilisée ainsi que de sa discontinuité.

La méthode présentée dans le livre consiste, pour un test bilatéral, à calculer le degré de signification pour le test unilatéral adéquat et à le comparer à α/2 = 0,025. Cela revient à le multiplier par deux et à le comparer à α = 0,05. Cette façon de faire peut conduire à un degré de signification jusqu'à deux fois trop grand, ce qui est le cas ici, d'où la controverse mentionnée dans le livre.

Haut de la page

Exemple 5.4.2. Comparaison de la sensibilité de deux races bovines à la trypanosomiase :
test approché

Le test approché, appliqué aux données de l'exemple 5.4.1, peut être réalisé avec ou sans correction de continuité. L'option par défaut de R est d'utiliser la correction de Yates :

tableau <- matrix(c(14,0,5,31),ncol=2)
prop.test(tableau)$p.value

[1] 1.108014e-07

Sans correction de continuité, on obtient :

prop.test(tableau,correct=F)$p.value

[1] 1.776076e-08

Ce dernier résultat correspond au test présenté dans le livre.

Remarque: un message d'avertissement se serait affiché si le produit des deux effectifs marginaux les plus petits n'était pas au moins cinq fois plus grand que l'effectif total (approximation normale non satisfaisante dans ce cas).

Haut de la page

Exemple 5.4.4. Comparaison de la sensibilité de deux races bovines à la trypanosomiase :
détermination des limites de confiance de la différence de sensibilité

Il faut être attentif ici à la disposition des données à l'intérieur du tableau de contingence : le logiciel considère en effet que les fréquences de succès et d'Èchec se trouvent en colonnes.

tableau <- matrix(c(14,0,5,31),ncol=2)
tableau

     [,1] [,2]
[1,]   14    5
[2,]    0   31

Par défaut, le logiciel utilise une correction de continuité pour calculer les limites de confiance de la différence :

prop.test(tableau)

        2-sample test for equality of proportions with continuity correction

data:  tableau 
X-squared = 28.1754, df = 1, p-value = 1.108e-07
alternative hypothesis: two.sided 
95 percent confidence interval:
 0.4963966 0.9772876 
sample estimates:
   prop 1    prop 2 
0.7368421 0.0000000

Les limites de confiance ainsi obtenues sont 0,50 et 0,98.

Sans correction de continuité, on retrouve les résultats du livre :

prop.test(tableau,correct=F)$conf.int

[1] 0.5388414 0.9348428

Haut de la page
Autres illustrations avec R




Dernière mise à jour : juin 2006