Statistique théorique et appliquée - Tome 2

 
Utilisation de R pour les exemples 7.4.1 et 8.4.1

Exemple 7.4.1
Exemple 8.4.1

par Emmanuel Nowak

 

Exemple 7.4.1. Comparaison des hauteurs moyennes des arbres de deux types de hêtraies : test d'égalité de deux variances

Il s'agit ici d'étudier les hauteurs des arbres observés dans les deux premiers types de hêtraies de l'exemple 2.3.1. Il faut tout d'abord importer les données fournies dans le fichier 's2e02031.txt', puis diviser les données par 10 afin d'obtenir des valeurs en mètres, supprimer les données correspondant au troisième type et, pour être rigoureux mais ce n'est pas indispensable, déclarer la variable 'Types' comme facteur :

s2e02031 <- read.table("C:/Dagnelie/st2donn/txt.2/s2e02031.txt",sep="\t",header=T)
s2e02031$Haut <- s2e02031$Haut/10
s2e07041 <- s2e02031[s2e02031$Types!=3,]
s2e07041$Types <- factor(s2e07041$Types)
summary(s2e07041)

Types       Haut      
 1:13   Min.   :22.50  
 2:14   1st Qu.:24.45  
        Median :26.20  
        Mean   :25.67  
        3rd Qu.:26.85  
        Max.   :28.50

La normalité et l'absence d'observations aberrantes ayant été vérifiées (exemples 3.3.1, 3.3.3, 3.4.1 et 3.5.1), on peut réaliser le test de Fisher permettant de comparer la variance des hauteurs dans les deux types de hêtraies :

attach(s2e07041)
var.test(Haut~Types)$p.value

[1] 0.3647079

Le résultat obtenu correspond bien à celui du livre puisqu'il faut ici comparer 0,36 à 0,05 au lieu de comparer 0,18 à 0,025 dans le livre.

Haut de la page

Exemple 8.4.1. Comparaison des hauteurs moyennes des arbres de deux types de hêtraies : test de Student et détermination des limites de confiance de la différence des moyennes

Le problème traité ici est la comparaison des hauteurs d'arbres moyennes dans les deux premiers types de hêtraies de l'exemple 2.3.1. Les données ont déjà été importées pour l'exemple 7.4.1 ci-dessus, afin de tester l'hypothèse d'égalité des variances. La normalité et l'absence d'observations aberrantes ont fait l'objet des exemples 3.3.1, 3.3.3, 3.4.1 et 3.5.1. On peut alors effectuer la comparaison des deux moyennes à l'aide du test t de Student avec variances supposées égales, et déterminer les limites de confiance de leur différence :

t.test(Haut~Types,var.equal=T)

        Two Sample t-test

data:  Haut by Types 
t = 0.9542, df = 25, p-value = 0.3491
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6759945  1.8430275 
sample estimates:
mean in group 1 mean in group 2 
       25.96923        25.38571

Le test de Welch, qui ne suppose pas que les variances sont égales et qui constitue l'option par défaut dans R, aurait donné des résultats très proches :

t.test(Haut~Types)

        Welch Two Sample t-test

data:  Haut by Types 
t = 0.9638, df = 24.168, p-value = 0.3447
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.6656157  1.8326487 
sample estimates:
mean in group 1 mean in group 2 
       25.96923        25.38571

Avant de traiter d'autres exemples, ne pas oublier de détacher le fichier de travail :

detach(s2e07041)

Haut de la page
Autres illustrations avec R




Dernière mise à jour : août 2006