Statistique théorique et appliquée - Tome 2

 
Utilisation de R pour les exemples 5.4.1, 5.4.2 et 5.4.4 (édition 2006)

Exemple 5.4.1
Exemple 5.4.2
Exemple 5.4.4

par Emmanuel Nowak

 

Exemple 5.4.1. Données de Pearson et Hartley : test de Fisher

Le but est de comparer les résultats obtenus par 29 ouvriers répartis en deux groupes, l'un soumis à un entraînement préalable et l'autre non.

Le logiciel R permet de calculer facilement la probabilité de rencontrer, quand l'hypothèse nulle est vraie, une répartition au moins aussi anormale que celle qui a été réellement observée. Cela donne, pour un test unilatéral :

tableau <- matrix(c(11,6,3,9),ncol=2)
fisher.test(tableau,alt="g")$p.value

[1] 0.04074805

Pour un test bilatéral, le logiciel R utilise une autre méthode que celle présentée dans le livre. Elle consiste à calculer les probabilités d'occurrence, quand l'hypothèse nulle est vraie, des différentes répartitions possibles, et de sommer toutes celles qui sont inférieures ou égales à la probabilité de la répartition réellement observée :

fisher.test(tableau)$p.value

[1] 0.06043294

La méthode présentée dans le livre consiste, pour un test bilatéral, à calculer le degré de signification pour le test unilatéral adéquat et à le comparer à α/2 = 0,025. Cela revient à le multiplier par deux et à le comparer à α = 0,05. Cette façon de faire peut conduire à surestimer considérablement le degré de signification, ce qui serait le cas ici, d'où la controverse mentionnée dans le livre.

Haut de la page

Exemple 5.4.2. Données de Pearson et Hartley : test approché

Le test approché, appliqué aux données de l'exemple 5.4.1, peut être réalisé avec ou sans correction de continuité. L'option par défaut de R est d'utiliser la correction de Yates :

tableau <- matrix(c(11,6,3,9),ncol=2)
prop.test(tableau,alt="g")$p.value

[1] 0.04179741

Sans correction de continuité, on obtient :

prop.test(tableau,alt="g",correct=F)$p.value

[1] 0.01753887

Ce dernier résultat correspond au test présenté dans le livre. Rappelons qu'il s'agit d'une alternative unilatérale.

Remarque: un message d'avertissement se serait affiché si le produit des deux effectifs marginaux les plus petits n'était pas au moins cinq fois plus grand que l'effectif total (approximation normale non satisfaisante dans ce cas).

Haut de la page

Exemple 5.4.4. Données de Pearson et Hartley : détermination des limites de confiance d'une différence de deux proportions

Il faut être attentif ici à la disposition des données à l'intérieur du tableau de contingence : le logiciel considère en effet que les fréquences de succès et d'echec se trouvent en colonnes.

tableau <- matrix(c(11,6,3,9),ncol=2)
tableau

     [,1] [,2]
[1,]   11    3
[2,]    6    9

Par défaut, le logiciel utilise une correction de continuité pour calculer les limites de confiance de la différence :

prop.test(tableau)

        2-sample test for equality of proportions with continuity correction

data:  tableau 
X-squared = 2.9936, df = 1, p-value = 0.0836
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.01145167  0.78288024 
sample estimates:
   prop 1    prop 2 
0.7857143 0.4000000

Les limites de confiance ainsi obtenues sont -0,01 et 0,78.

Sans correction de continuité, on retrouve les résultats du livre :

prop.test(tableau,correct=F)$conf.int

[1] 0.05759595 0.71383262

Haut de la page
Autres illustrations avec R




Dernière mise à jour : juin 2006