Séance 08

´ PARIS OUEST NANTERRE LA DEFENSE
´
UNIVERSITE
U.F.R. SEGMI
Ann´ee universitaire 2014 – 2015
´
L2 Economie
Cours de B. Desgraupes
M´
ethodes Statistiques
S´
eance 08:
Tests de comparaison I
Table des mati`
eres
1 Comparaison de deux param`
etres
1
2 Comparaison de deux moyennes (petits ´
echantillons)
2.1 Principe du test . . . . . . . . . . . . . . . . . . . . . . .
2.2 Hypoth`eses sur les variables . . . . . . . . . . . . . . . .
´
´
2.3 Echantillons
appari´es versus Echantillons
ind´ependants .
2.4 Estimation ponctuelle . . . . . . . . . . . . . . . . . . .
2.5 Statistique de test . . . . . . . . . . . . . . . . . . . . .
2.6 D´ecision . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3 Comparaison de deux moyennes (grands ´
echantillons)
4 Table de Student
1
.
.
.
.
.
.
.
.
.
.
.
.
3
3
3
4
4
5
6
8
10
Comparaison de deux param`
etres
On consid`ere deux param`etres θ1 et θ2 de deux distributions X1 et X2 .
Population 1
X1
Population 2
X2
θ1 ?
θ2 ?
Objectif
Comparer θ1 et θ2 `
a l’aide d’un test.
1
Exemple 1
Un physiologiste pense que la force musculaire est accrue par l’absorption d’un
produit A. La force musculaire est mesur´ee par la force de pr´ehension (pression
exerc´ee sur un certain objet; plus la valeur est ´elev´ee, plus la force musculaire
est importante).
Population 1 : personnes n’ayant pas absorb´e le produit A
Variable 1 : force de pr´ehension X1
Param`
etre 1 : m1 = moyenne de X1
Population 2 : personnes ayant absorb´e le produit A
Variable 2 : force de pr´ehension X2
Param`
etre 2 : m2 = moyenne de X2
Question
m1 < m2 ?
Exemple 2
Dans une pisciculture, on ´etudie l’effet de deux r´egimes alimentaires, que l’on
appellera “r´egime 1” et “r´egime 2”, sur la croissance d’une esp`ece de poisson.
Pour ce faire, on alimente un lot de poissons avec le r´egime 1 et un autre lot
avec le r´egime 2.
Population 1 : poissons aliment´es avec le r´egime 1
Variable 1 : longueur X1
Param`
etre 1 : m1 = moyenne de X1
Population 2 : poissons aliment´es avec le r´egime 2
Variable 2 : longueur X2
Param`
etre 2 : m2 = moyenne de X2
Question
m1 6= m2 ?
L’hypoth`ese H0 est l’hypoth`ese d’´egalit´e :
• H0 : θ1 = θ2
L’hypoth`ese H1 est une des trois hypoth`eses suivantes :
• H1 : θ1 6= θ2
2
• H1 : θ1 < θ2
• H1 : θ1 > θ2
Exemple 1
Les hypoth`eses du test sont
H0 : m1 = m2 H1 : m1 < m2
et on choisit la valeur du risque : α = 5%.
Exemple 2
Les hypoth`eses du test sont
H0 : m1 = m2 H1 : m1 6= m2
et on choisit la valeur du risque : α = 5%.
2
2.1
Comparaison de deux moyennes (petits ´
echantillons)
Principe du test
Population 1
X1
Population 2
X2
m1 ?
m2 ?
´
Echantillon
de X1
¯1
X
´
Echantillon
de X2
¯2
X
On dispose de deux ´echantillons sur
lesquels on observe les moyennes
¯ 1 et X
¯2.
empiriques X
Id´
ee
Comparer m1 et m2 revient `a comparer la position de m1 − m2 par rapport `a 0
(=, 6=, >, <).
Estimateur
¯1 − X
¯2.
Un estimateur de m1 − m2 est X
2.2
Hypoth`
eses sur les variables
A l’instar du test de conformit´e d’une moyenne `a une valeur th´eorique, il existe
plusieurs proc´edures selon que l’on suppose connue ou non la distribution des
variables X1 et X2 , et que l’on dispose d’un grand ou petit ´echantillon.
Dans ce cours, nous ne pr´esentons pas toutes les proc´edures possibles. Nous
supposerons `
a partir de maintenant que les deux hypoth`eses suivantes sont v´erifi´ees.
3
Hypoth`
ese de normalit´
e
Les variables X1 et X2 sont distribu´ees selon une loi normale.
´
Egalit´
e des variances
Les variances des variables X1 et X2 sont ´egales.
En d’autres termes, on suppose que
X1 ∼ N (m1 , σ)
2.3
X2 ∼ N (m2 , σ)
´
´
Echantillons
appari´
es versus Echantillons
ind´
ependants
Exemple 1
Pour r´epondre `
a la question, le physiologiste mesure pour 10 personnes choisies
au hasard leurs forces de pr´ehension avant et apr`es absorption du produit A.
On mesure donc la force de pr´ehension pour une mˆeme personne !
On consid`ere donc qu’on observe pour une mˆeme personne le couple (X1 , X2 ).
D´
efinition 2.1. On appelle de tels ´echantillons des ´echantillons appari´
es.
Exemple 2
On fait suivre le r´egime alimentaire 1 `a 9 poissons choisis au hasard et le r´egime
2`
a 8 poissons choisis au hasard.
Contrairement `
a l’exemple pr´ec´edent, on fait suivre chaque r´egime alimentaire `
a des lots diff´erents de poissons.
D´
efinition 2.2. On appelle de tels ´echantillons des ´echantillons ind´
ependants.
2.4
Estimation ponctuelle
¯ =X
¯1 − X
¯2
L’estimateur de m1 − m2 est D
Exemple 1
1
2
3
4
5
6
7
8
9
10
X1
19.60
11.20
9.00
25.10
28.40
17.90
6.50
32.00
11.60
24.00
4
X2
20.20
13.40
8.50
27.40
31.50
17.60
7.30
37.50
12.00
22.90
On calcule :
¯1
X
¯2
X
=
18.5
=
19.8
Estimation ponctuelle de m1 − m2 :
¯1 − X
¯ 2 = −1.3
d=X
Exemple 2
X1
X2
1
21.18
22.39
2
20.01
21.26
3
22.50
22.17
4
22.97
25.00
5
21.83
22.21
6
23.42
20.51
7
18.61
22.36
8
25.20
24.49
9
22.07
On calcule :
¯1
X
¯2
X
=
22
=
22.5
Estimation ponctuelle de m1 − m2 :
¯1 − X
¯ 2 = −0.5
X
2.5
Statistique de test
Notons n la taille des ´echantillons appari´es. Notons Di la variable mesurant la
diff´erence entre X1 et X2 pour le i-`eme individu de l’´echantillon.
Introduisons la variance empirique modifi´ee s2app associ´ee `a D = X1 − X2 :
n
s2app
1 X
¯ 2= 1
=
Di − D
n − 1 i=1
n−1
n
X
!
¯2
Di2 − nD
i=1
L’indice app indique que les ´echantillons sont appari´es.
Th´
eor`
eme 2.1.
Sous H0 ,
√
n
¯
D
∼ T (n − 1)
sapp
loi de Student `
a n − 1 degr´es de libert´e.
Exemple 1 : n = 10
Sous H0 , t =
√
10
5
¯
D
∼ T (9)
sapp
Notons n1 et n2 les tailles respectives des ´echantillons de X1 et X2 .
Notons s21 et s22 les variances empiriques modifi´ees associ´ees, respectivement,
a X1 et `
`
a X2 .
D´efinissons l’estimateur suivant :
s2ind =
(n1 − 1)s21 + (n2 − 1)s22
n1 + n2 − 2
L’indice ind indique que les ´echantillons sont ind´ependants.
Lorsque les deux variables X1 et `a X2 ont la mˆeme variance σ, on montre
que sind est un estimateur de ce σ commun. On verra, par la suite, un test
de comparaison des variances qui permet justement de v´erifier l’hypoth`ese que
σ1 = σ2 (et qui devra toujours ˆetre effectu´e au pr´ealable).
Th´
eor`
eme 2.2.
Sous H0 , T =
¯1 − X
¯2
X
r
∼ T (n1 + n2 − 2)
1
1
sind
+
n1
n2
loi de Student `
a n1 + n2 − 2 degr´es de libert´e.
Exemple 2 : n1 = 9, n2 = 8
Sous H0 , t =
2.6
¯1 − X
¯
X
q 2 ∼ T15
sind 19 + 18
D´
ecision
A l’instar d’un test de conformit´e, nous allons d´eterminer un intervalle d’acceptation
th´eorique sur T .
´
Etant
donn´e le seuil α, l’intervalle d’acceptation IA1−α (T ) sur T d´epend de
l’hypoth`ese H1 (on note ici tβ le quantile de T d’ordre β),
m1 < m2 : IA1−α (T ) = [−t1−α ; +∞[
m1 > m2 : IA1−α (T ) =] − ∞ ; t1−α ]
m1 6= m2 : IA1−α (T ) = [−t1− α2 ; t1− α2 ]
La r`egle de d´ecision est alors la mˆeme que pour un test de conformit´e : on
calcule la valeur observ´ee tobs de T et on conclut de la mani`ere suivante
• si tobs ∈ IA1−α (T ) alors on accepte H0 ;
6
• si tobs 6∈ IA1−α (T ) alors on rejette H0 .
Exemple 1
α = 0, 05
1
2
3
4
5
6
7
8
9
10
Observations :
s2app
−
X1
19.60
11.20
9.00
25.10
28.40
17.90
6.50
32.00
11.60
24.00
n = 10
X2
20.20
13.40
8.50
27.40
31.50
17.60
7.30
37.50
12.00
22.90
D
-0.60
-2.20
0.50
-2.30
-3.10
0.30
-0.80
-5.50
-0.40
1.10
d¯ = −1.3
√
= 3.978, sapp = 3.978 = 1.994
tobs =
√
10 ×
−1.3
= −2.061
1.994
Intervalle d’acceptation th´eorique :
H1 : m1 < m2
1 − α = 0.95, n − 1 = 9
t1−α = t0.95 = 1.833 (table)
IA0.95 (T ) =] − 1.833 ; +∞[
On rejette H0 car tobs 6∈ IA0.95 (T ). On conclut que l’absorption du produit A
augmente la force musculaire.
Exemple 2
α = 0.05
X1
X2
1
21.18
22.39
2
20.01
21.26
3
22.50
22.17
−
4
22.97
25.00
n1 = 9
5
21.83
22.21
7
−
n2 = 8
6
23.42
20.51
7
18.61
22.36
8
25.20
24.49
9
22.07
Observations :
d¯ = −0.5, s21 = 3.7, s22 = 2.273
s2ind =
8 × 3.7 + 7 × 2.273
= 3.034
15
tobs = √
−0.5
q
3.034 19 +
1
8
= −0.591
Intervalle d’acceptation th´eorique :
H1 : m1 6= m2
1−
α
= 0.975,
2
n1 + n2 − 2 = 15
t0.975 = 2.131 (table)
IA0.95 (T ) = [−2.131 ; 2.131]
On accepte H0 car tobs ∈ IA0.95 (T ). On ne peut pas conclure qu’il y a un
effet du r´egime alimentaire sur la croissance des poissons.
3
Comparaison de deux moyennes (grands ´
echantillons)
Dans le cas o`
u on a de grands ´echantillons, on fait l’approximation des lois de
Student par la loi normale.
´
• Echantillons
ind´
ependants Si les ´echantillons sont ind´ependants et que
n1 > 30 et n2 > 30, la variable al´eatoire
¯1 − X
¯2
X
U=q 2
σ1
σ22
n1 + n2
suit approximativement une loi normale N (0, 1).
Si les variances σ12 et σ22 ne sont pas connues, on les remplace par s21 et s22
respectivement.
´
• Echantillons
appari´
es Si les ´echantillons sont appari´es et que n > 30, on
calcule
¯
√ D
U= n
sapp
qui suit approximativement une loi normale N (0, 1).
8
Exemple 3
On veut comparer, entre les deux UP (U P1 et U P2 ), les r´esultats `a l’examen
de statistiques. On pr´el`eve pour cela 40 copies dans chaque UP. On observe les
r´esultats suivants :
x
¯1 = 9.4
s1 = 2.2
x
¯2 = 10.4
s2 = 2.8
On ex´ecutera le test au seuil 5%.
Il s’agit d’un test de comparaison de moyennes pour deux grands ´echantillons. On calcule :
9.4 − 10.4
x
¯1 − x
¯2
=q
= −1.776
U=q 2
s1
s22
2.22
2.82
40 + 40
n1 + n2
La valeur −1.776 obtenue pour U est dans l’intervalle [−1, 96 ; 1, 96] et on
accepte l’hypoth`ese que les r´esultats sont identiques dans les deux U P .
Exemple 4
On veut comparer les r´esultats de la correction d’un paquet de 40 copies par
deux examinateurs diff´erents (A et B). On a observ´e les notes suivantes :
A
B
A
B
A
B
A
B
7
8
16
15
14
16
15
19
11
13
12
10
13
13
10
13
7
7
8
10
10
9
12
12
16
16
1
5
2
6
10
11
11
14
14
17
12
14
4
3
7
6
10
13
10
9
8
6
12
14
10
11
9
7
8
11
13
11
14
14
4
5
10
8
12
11
13
16
8
12
14
15
9
8
12
14
12
14
13
15
Les moyennes obtenues sont-elles significativement diff´erentes ?
Il s’agit d’un test sur des ´echantillons appari´es puisque c’est le mˆeme paquet
de copies qui est corrig´e par deux examinateurs diff´erents.
La moyenne obtenue par le premier correcteur est x
¯1 = 10.325 et celle
obtenue par le deuxi`eme correcteur est x
¯2 = 11.275.
On calcule la diff´erence D des notes pour chacune des 40 copies :
-1
1
-2
-4
-2
2
0
-3
0
-2
1
0
0
-4
-4
-1
-3
-3
-2
1
1
-3
1
2
-2
-1
2
-3
2
0
-1
2
1
-3
-4
-1
1
-2
-2
-2
¯ =x
La moyenne des diff´erences est D
¯1 − x
¯2 = −0.95 et l’´ecart-type modifi´e de
D est sapp = 1.934.
On obtient donc
√
−0.95
U = 40 ×
= −3.113
1.934
9
On ex´ecute encore le test au seuil 5%. La valeur −3.113 obtenue pour U n’est
pas dans l’intervalle [−1, 96 ; 1, 96] et on rejette – au risque 5% de se tromper
– l’hypoth`ese que les r´esultats ne diff`erent pas significativement entre les deux
correcteurs. Le second correcteur est significativement plus cl´ement...
4
Table de Student
Fonction quantile de la loi de Student
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0.6
0.3249
0.2887
0.2767
0.2707
0.2672
0.2648
0.2632
0.2619
0.2610
0.2602
0.2596
0.2590
0.2586
0.2582
0.2579
0.2576
0.2573
0.2571
0.2569
0.2567
0.2566
0.2564
0.2563
0.2562
0.2561
0.2560
0.2559
0.2558
0.2557
0.2556
0.7
0.7265
0.6172
0.5844
0.5686
0.5594
0.5534
0.5491
0.5459
0.5435
0.5415
0.5399
0.5386
0.5375
0.5366
0.5357
0.5350
0.5344
0.5338
0.5333
0.5329
0.5325
0.5321
0.5317
0.5314
0.5312
0.5309
0.5306
0.5304
0.5302
0.5300
0.8
1.3764
1.0607
0.9785
0.9410
0.9195
0.9057
0.8960
0.8889
0.8834
0.8791
0.8755
0.8726
0.8702
0.8681
0.8662
0.8647
0.8633
0.8620
0.8610
0.8600
0.8591
0.8583
0.8575
0.8569
0.8562
0.8557
0.8551
0.8546
0.8542
0.8538
0.9
3.0777
1.8856
1.6377
1.5332
1.4759
1.4398
1.4149
1.3968
1.3830
1.3722
1.3634
1.3562
1.3502
1.3450
1.3406
1.3368
1.3334
1.3304
1.3277
1.3253
1.3232
1.3212
1.3195
1.3178
1.3163
1.3150
1.3137
1.3125
1.3114
1.3104
10
0.95
6.3138
2.9200
2.3534
2.1318
2.0150
1.9432
1.8946
1.8595
1.8331
1.8125
1.7959
1.7823
1.7709
1.7613
1.7531
1.7459
1.7396
1.7341
1.7291
1.7247
1.7207
1.7171
1.7139
1.7109
1.7081
1.7056
1.7033
1.7011
1.6991
1.6973
0.975
12.7062
4.3027
3.1824
2.7764
2.5706
2.4469
2.3646
2.3060
2.2622
2.2281
2.2010
2.1788
2.1604
2.1448
2.1314
2.1199
2.1098
2.1009
2.0930
2.0860
2.0796
2.0739
2.0687
2.0639
2.0595
2.0555
2.0518
2.0484
2.0452
2.0423
0.99
31.8205
6.9646
4.5407
3.7469
3.3649
3.1427
2.9980
2.8965
2.8214
2.7638
2.7181
2.6810
2.6503
2.6245
2.6025
2.5835
2.5669
2.5524
2.5395
2.5280
2.5176
2.5083
2.4999
2.4922
2.4851
2.4786
2.4727
2.4671
2.4620
2.4573
0.995
63.6567
9.9248
5.8409
4.6041
4.0321
3.7074
3.4995
3.3554
3.2498
3.1693
3.1058
3.0545
3.0123
2.9768
2.9467
2.9208
2.8982
2.8784
2.8609
2.8453
2.8314
2.8188
2.8073
2.7969
2.7874
2.7787
2.7707
2.7633
2.7564
2.7500