Statistique théorique et appliquée - Tome 2

 
Utilisation de R pour les exemples 7.4.2 et 8.4.2

Exemple 7.4.2
Exemple 8.4.2

par Emmanuel Nowak

 

Exemple 7.4.2. Comparaison de deux méthodes d'échantillonnage du sol : comparaison des variances

Il s'agit ici de comparer les teneurs en K2O obtenues à l'aide de deux méthodes. Il faut tout d'abord importer les données fournies dans le fichier 's2e07042.txt', en tenant compte qu'elles sont présentées sous la forme de deux colonnes de longueurs différentes, et diviser les données par 10 afin d'obtenir des valeurs en parts par million :

s2e07042 <- read.table("C:/Dagnelie/st2donn/txt.2/s2e07042.txt",sep="\t",header=T,fill=T)
s2e07042 <- s2e07042/10
summary(s2e07042)

     Indiv           Moyen      
 Min.   : 8.00   Min.   : 9.60  
 1st Qu.: 9.20   1st Qu.:10.40  
 Median :12.60   Median :10.80  
 Mean   :12.96   Mean   :10.92  
 3rd Qu.:14.90   3rd Qu.:11.40  
 Max.   :22.00   Max.   :12.80  
                 NA's   :10.00

Etant donné les modes d'obtention des échantillons, on peut s'attendre à ce que le rapport des variances soit égal à 25. C'est l'hypothèse qui est testée ci-dessous, le résultat étant assorti d'une estimation et des limites de confiance du rapport des variances :

attach(s2e07042)
var.test(Indiv,Moyen,ratio=25)

        F test to compare two variances

data:  Indiv and Moyen 
F = 0.6884, num df = 19, denom df = 9, p-value = 0.4704
alternative hypothesis: true ratio of variances is not equal to 25 
95 percent confidence interval:
  4.672124 49.562847 
sample estimates:
ratio of variances 
          17.20901

Les résultats obtenus correspondent bien à ceux du livre puisqu'il faut ici comparer 0,47 à 0,05 au lieu de comparer 0,24 (en arrondissant) à 0,025 dans le livre. Le calcul des limites de confiance effectué dans l'édition de 1998 a fait l'objet d'une correction. La valeur de F est l'inverse de celle du livre, cela n'ayant aucune incidence puisque les degrés de liberté sont également inversés.

Haut de la page

Exemple 8.4.2. Comparaison de deux méthodes d'échantillonnage du sol : test Welch et détermination des limites de confiance de la différence des moyennes

Le problème est ici de savoir si les deux méthodes présentées dans l'exemple 7.4.2 donnent, en moyenne, des résultats identiques. Les données ont déjà été importées ci-dessus afin d'étudier le rapport des variances, qui doit être considéré comme différent de l'unité. On va donc comparer les deux moyennes à l'aide du test de Welch, qui correspond à l'option par défaut du test t de Student dans R, et déterminer les limites de confiance de leur différence :

t.test(Indiv,Moyen)

        Welch Two Sample t-test

data:  Indiv and Moyen 
t = 2.1629, df = 23.017, p-value = 0.04118
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 0.08895913 3.99104087 
sample estimates:
mean of x mean of y 
    12.96     10.92

Le test de Student, supposant les variances égales, aurait donné des résultats très différents :

t.test(Indiv,Moyen,var.equal=T)

        Two Sample t-test

data:  Indiv and Moyen 
t = 1.58, df = 28, p-value = 0.1253
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.604792  4.684792 
sample estimates:
mean of x mean of y 
    12.96     10.92

Avant de traiter d'autres exemples, ne pas oublier de détacher le fichier de travail :

detach(s2e07042)

Haut de la page
Autres illustrations avec R




Dernière mise à jour : août 2006