´ PARIS OUEST NANTERRE LA DEFENSE ´ UNIVERSITE U.F.R. SEGMI Ann´ee universitaire 2014 – 2015 ´ L2 Economie Cours de B. Desgraupes M´ ethodes Statistiques S´ eance 08: Tests de comparaison I Table des mati` eres 1 Comparaison de deux param` etres 1 2 Comparaison de deux moyennes (petits ´ echantillons) 2.1 Principe du test . . . . . . . . . . . . . . . . . . . . . . . 2.2 Hypoth`eses sur les variables . . . . . . . . . . . . . . . . ´ ´ 2.3 Echantillons appari´es versus Echantillons ind´ependants . 2.4 Estimation ponctuelle . . . . . . . . . . . . . . . . . . . 2.5 Statistique de test . . . . . . . . . . . . . . . . . . . . . 2.6 D´ecision . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Comparaison de deux moyennes (grands ´ echantillons) 4 Table de Student 1 . . . . . . . . . . . . 3 3 3 4 4 5 6 8 10 Comparaison de deux param` etres On consid`ere deux param`etres θ1 et θ2 de deux distributions X1 et X2 . Population 1 X1 Population 2 X2 θ1 ? θ2 ? Objectif Comparer θ1 et θ2 ` a l’aide d’un test. 1 Exemple 1 Un physiologiste pense que la force musculaire est accrue par l’absorption d’un produit A. La force musculaire est mesur´ee par la force de pr´ehension (pression exerc´ee sur un certain objet; plus la valeur est ´elev´ee, plus la force musculaire est importante). Population 1 : personnes n’ayant pas absorb´e le produit A Variable 1 : force de pr´ehension X1 Param` etre 1 : m1 = moyenne de X1 Population 2 : personnes ayant absorb´e le produit A Variable 2 : force de pr´ehension X2 Param` etre 2 : m2 = moyenne de X2 Question m1 < m2 ? Exemple 2 Dans une pisciculture, on ´etudie l’effet de deux r´egimes alimentaires, que l’on appellera “r´egime 1” et “r´egime 2”, sur la croissance d’une esp`ece de poisson. Pour ce faire, on alimente un lot de poissons avec le r´egime 1 et un autre lot avec le r´egime 2. Population 1 : poissons aliment´es avec le r´egime 1 Variable 1 : longueur X1 Param` etre 1 : m1 = moyenne de X1 Population 2 : poissons aliment´es avec le r´egime 2 Variable 2 : longueur X2 Param` etre 2 : m2 = moyenne de X2 Question m1 6= m2 ? L’hypoth`ese H0 est l’hypoth`ese d’´egalit´e : • H0 : θ1 = θ2 L’hypoth`ese H1 est une des trois hypoth`eses suivantes : • H1 : θ1 6= θ2 2 • H1 : θ1 < θ2 • H1 : θ1 > θ2 Exemple 1 Les hypoth`eses du test sont H0 : m1 = m2 H1 : m1 < m2 et on choisit la valeur du risque : α = 5%. Exemple 2 Les hypoth`eses du test sont H0 : m1 = m2 H1 : m1 6= m2 et on choisit la valeur du risque : α = 5%. 2 2.1 Comparaison de deux moyennes (petits ´ echantillons) Principe du test Population 1 X1 Population 2 X2 m1 ? m2 ? ´ Echantillon de X1 ¯1 X ´ Echantillon de X2 ¯2 X On dispose de deux ´echantillons sur lesquels on observe les moyennes ¯ 1 et X ¯2. empiriques X Id´ ee Comparer m1 et m2 revient `a comparer la position de m1 − m2 par rapport `a 0 (=, 6=, >, <). Estimateur ¯1 − X ¯2. Un estimateur de m1 − m2 est X 2.2 Hypoth` eses sur les variables A l’instar du test de conformit´e d’une moyenne `a une valeur th´eorique, il existe plusieurs proc´edures selon que l’on suppose connue ou non la distribution des variables X1 et X2 , et que l’on dispose d’un grand ou petit ´echantillon. Dans ce cours, nous ne pr´esentons pas toutes les proc´edures possibles. Nous supposerons ` a partir de maintenant que les deux hypoth`eses suivantes sont v´erifi´ees. 3 Hypoth` ese de normalit´ e Les variables X1 et X2 sont distribu´ees selon une loi normale. ´ Egalit´ e des variances Les variances des variables X1 et X2 sont ´egales. En d’autres termes, on suppose que X1 ∼ N (m1 , σ) 2.3 X2 ∼ N (m2 , σ) ´ ´ Echantillons appari´ es versus Echantillons ind´ ependants Exemple 1 Pour r´epondre ` a la question, le physiologiste mesure pour 10 personnes choisies au hasard leurs forces de pr´ehension avant et apr`es absorption du produit A. On mesure donc la force de pr´ehension pour une mˆeme personne ! On consid`ere donc qu’on observe pour une mˆeme personne le couple (X1 , X2 ). D´ efinition 2.1. On appelle de tels ´echantillons des ´echantillons appari´ es. Exemple 2 On fait suivre le r´egime alimentaire 1 `a 9 poissons choisis au hasard et le r´egime 2` a 8 poissons choisis au hasard. Contrairement ` a l’exemple pr´ec´edent, on fait suivre chaque r´egime alimentaire ` a des lots diff´erents de poissons. D´ efinition 2.2. On appelle de tels ´echantillons des ´echantillons ind´ ependants. 2.4 Estimation ponctuelle ¯ =X ¯1 − X ¯2 L’estimateur de m1 − m2 est D Exemple 1 1 2 3 4 5 6 7 8 9 10 X1 19.60 11.20 9.00 25.10 28.40 17.90 6.50 32.00 11.60 24.00 4 X2 20.20 13.40 8.50 27.40 31.50 17.60 7.30 37.50 12.00 22.90 On calcule : ¯1 X ¯2 X = 18.5 = 19.8 Estimation ponctuelle de m1 − m2 : ¯1 − X ¯ 2 = −1.3 d=X Exemple 2 X1 X2 1 21.18 22.39 2 20.01 21.26 3 22.50 22.17 4 22.97 25.00 5 21.83 22.21 6 23.42 20.51 7 18.61 22.36 8 25.20 24.49 9 22.07 On calcule : ¯1 X ¯2 X = 22 = 22.5 Estimation ponctuelle de m1 − m2 : ¯1 − X ¯ 2 = −0.5 X 2.5 Statistique de test Notons n la taille des ´echantillons appari´es. Notons Di la variable mesurant la diff´erence entre X1 et X2 pour le i-`eme individu de l’´echantillon. Introduisons la variance empirique modifi´ee s2app associ´ee `a D = X1 − X2 : n s2app 1 X ¯ 2= 1 = Di − D n − 1 i=1 n−1 n X ! ¯2 Di2 − nD i=1 L’indice app indique que les ´echantillons sont appari´es. Th´ eor` eme 2.1. Sous H0 , √ n ¯ D ∼ T (n − 1) sapp loi de Student ` a n − 1 degr´es de libert´e. Exemple 1 : n = 10 Sous H0 , t = √ 10 5 ¯ D ∼ T (9) sapp Notons n1 et n2 les tailles respectives des ´echantillons de X1 et X2 . Notons s21 et s22 les variances empiriques modifi´ees associ´ees, respectivement, a X1 et ` ` a X2 . D´efinissons l’estimateur suivant : s2ind = (n1 − 1)s21 + (n2 − 1)s22 n1 + n2 − 2 L’indice ind indique que les ´echantillons sont ind´ependants. Lorsque les deux variables X1 et `a X2 ont la mˆeme variance σ, on montre que sind est un estimateur de ce σ commun. On verra, par la suite, un test de comparaison des variances qui permet justement de v´erifier l’hypoth`ese que σ1 = σ2 (et qui devra toujours ˆetre effectu´e au pr´ealable). Th´ eor` eme 2.2. Sous H0 , T = ¯1 − X ¯2 X r ∼ T (n1 + n2 − 2) 1 1 sind + n1 n2 loi de Student ` a n1 + n2 − 2 degr´es de libert´e. Exemple 2 : n1 = 9, n2 = 8 Sous H0 , t = 2.6 ¯1 − X ¯ X q 2 ∼ T15 sind 19 + 18 D´ ecision A l’instar d’un test de conformit´e, nous allons d´eterminer un intervalle d’acceptation th´eorique sur T . ´ Etant donn´e le seuil α, l’intervalle d’acceptation IA1−α (T ) sur T d´epend de l’hypoth`ese H1 (on note ici tβ le quantile de T d’ordre β), m1 < m2 : IA1−α (T ) = [−t1−α ; +∞[ m1 > m2 : IA1−α (T ) =] − ∞ ; t1−α ] m1 6= m2 : IA1−α (T ) = [−t1− α2 ; t1− α2 ] La r`egle de d´ecision est alors la mˆeme que pour un test de conformit´e : on calcule la valeur observ´ee tobs de T et on conclut de la mani`ere suivante • si tobs ∈ IA1−α (T ) alors on accepte H0 ; 6 • si tobs 6∈ IA1−α (T ) alors on rejette H0 . Exemple 1 α = 0, 05 1 2 3 4 5 6 7 8 9 10 Observations : s2app − X1 19.60 11.20 9.00 25.10 28.40 17.90 6.50 32.00 11.60 24.00 n = 10 X2 20.20 13.40 8.50 27.40 31.50 17.60 7.30 37.50 12.00 22.90 D -0.60 -2.20 0.50 -2.30 -3.10 0.30 -0.80 -5.50 -0.40 1.10 d¯ = −1.3 √ = 3.978, sapp = 3.978 = 1.994 tobs = √ 10 × −1.3 = −2.061 1.994 Intervalle d’acceptation th´eorique : H1 : m1 < m2 1 − α = 0.95, n − 1 = 9 t1−α = t0.95 = 1.833 (table) IA0.95 (T ) =] − 1.833 ; +∞[ On rejette H0 car tobs 6∈ IA0.95 (T ). On conclut que l’absorption du produit A augmente la force musculaire. Exemple 2 α = 0.05 X1 X2 1 21.18 22.39 2 20.01 21.26 3 22.50 22.17 − 4 22.97 25.00 n1 = 9 5 21.83 22.21 7 − n2 = 8 6 23.42 20.51 7 18.61 22.36 8 25.20 24.49 9 22.07 Observations : d¯ = −0.5, s21 = 3.7, s22 = 2.273 s2ind = 8 × 3.7 + 7 × 2.273 = 3.034 15 tobs = √ −0.5 q 3.034 19 + 1 8 = −0.591 Intervalle d’acceptation th´eorique : H1 : m1 6= m2 1− α = 0.975, 2 n1 + n2 − 2 = 15 t0.975 = 2.131 (table) IA0.95 (T ) = [−2.131 ; 2.131] On accepte H0 car tobs ∈ IA0.95 (T ). On ne peut pas conclure qu’il y a un effet du r´egime alimentaire sur la croissance des poissons. 3 Comparaison de deux moyennes (grands ´ echantillons) Dans le cas o` u on a de grands ´echantillons, on fait l’approximation des lois de Student par la loi normale. ´ • Echantillons ind´ ependants Si les ´echantillons sont ind´ependants et que n1 > 30 et n2 > 30, la variable al´eatoire ¯1 − X ¯2 X U=q 2 σ1 σ22 n1 + n2 suit approximativement une loi normale N (0, 1). Si les variances σ12 et σ22 ne sont pas connues, on les remplace par s21 et s22 respectivement. ´ • Echantillons appari´ es Si les ´echantillons sont appari´es et que n > 30, on calcule ¯ √ D U= n sapp qui suit approximativement une loi normale N (0, 1). 8 Exemple 3 On veut comparer, entre les deux UP (U P1 et U P2 ), les r´esultats `a l’examen de statistiques. On pr´el`eve pour cela 40 copies dans chaque UP. On observe les r´esultats suivants : x ¯1 = 9.4 s1 = 2.2 x ¯2 = 10.4 s2 = 2.8 On ex´ecutera le test au seuil 5%. Il s’agit d’un test de comparaison de moyennes pour deux grands ´echantillons. On calcule : 9.4 − 10.4 x ¯1 − x ¯2 =q = −1.776 U=q 2 s1 s22 2.22 2.82 40 + 40 n1 + n2 La valeur −1.776 obtenue pour U est dans l’intervalle [−1, 96 ; 1, 96] et on accepte l’hypoth`ese que les r´esultats sont identiques dans les deux U P . Exemple 4 On veut comparer les r´esultats de la correction d’un paquet de 40 copies par deux examinateurs diff´erents (A et B). On a observ´e les notes suivantes : A B A B A B A B 7 8 16 15 14 16 15 19 11 13 12 10 13 13 10 13 7 7 8 10 10 9 12 12 16 16 1 5 2 6 10 11 11 14 14 17 12 14 4 3 7 6 10 13 10 9 8 6 12 14 10 11 9 7 8 11 13 11 14 14 4 5 10 8 12 11 13 16 8 12 14 15 9 8 12 14 12 14 13 15 Les moyennes obtenues sont-elles significativement diff´erentes ? Il s’agit d’un test sur des ´echantillons appari´es puisque c’est le mˆeme paquet de copies qui est corrig´e par deux examinateurs diff´erents. La moyenne obtenue par le premier correcteur est x ¯1 = 10.325 et celle obtenue par le deuxi`eme correcteur est x ¯2 = 11.275. On calcule la diff´erence D des notes pour chacune des 40 copies : -1 1 -2 -4 -2 2 0 -3 0 -2 1 0 0 -4 -4 -1 -3 -3 -2 1 1 -3 1 2 -2 -1 2 -3 2 0 -1 2 1 -3 -4 -1 1 -2 -2 -2 ¯ =x La moyenne des diff´erences est D ¯1 − x ¯2 = −0.95 et l’´ecart-type modifi´e de D est sapp = 1.934. On obtient donc √ −0.95 U = 40 × = −3.113 1.934 9 On ex´ecute encore le test au seuil 5%. La valeur −3.113 obtenue pour U n’est pas dans l’intervalle [−1, 96 ; 1, 96] et on rejette – au risque 5% de se tromper – l’hypoth`ese que les r´esultats ne diff`erent pas significativement entre les deux correcteurs. Le second correcteur est significativement plus cl´ement... 4 Table de Student Fonction quantile de la loi de Student 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 0.6 0.3249 0.2887 0.2767 0.2707 0.2672 0.2648 0.2632 0.2619 0.2610 0.2602 0.2596 0.2590 0.2586 0.2582 0.2579 0.2576 0.2573 0.2571 0.2569 0.2567 0.2566 0.2564 0.2563 0.2562 0.2561 0.2560 0.2559 0.2558 0.2557 0.2556 0.7 0.7265 0.6172 0.5844 0.5686 0.5594 0.5534 0.5491 0.5459 0.5435 0.5415 0.5399 0.5386 0.5375 0.5366 0.5357 0.5350 0.5344 0.5338 0.5333 0.5329 0.5325 0.5321 0.5317 0.5314 0.5312 0.5309 0.5306 0.5304 0.5302 0.5300 0.8 1.3764 1.0607 0.9785 0.9410 0.9195 0.9057 0.8960 0.8889 0.8834 0.8791 0.8755 0.8726 0.8702 0.8681 0.8662 0.8647 0.8633 0.8620 0.8610 0.8600 0.8591 0.8583 0.8575 0.8569 0.8562 0.8557 0.8551 0.8546 0.8542 0.8538 0.9 3.0777 1.8856 1.6377 1.5332 1.4759 1.4398 1.4149 1.3968 1.3830 1.3722 1.3634 1.3562 1.3502 1.3450 1.3406 1.3368 1.3334 1.3304 1.3277 1.3253 1.3232 1.3212 1.3195 1.3178 1.3163 1.3150 1.3137 1.3125 1.3114 1.3104 10 0.95 6.3138 2.9200 2.3534 2.1318 2.0150 1.9432 1.8946 1.8595 1.8331 1.8125 1.7959 1.7823 1.7709 1.7613 1.7531 1.7459 1.7396 1.7341 1.7291 1.7247 1.7207 1.7171 1.7139 1.7109 1.7081 1.7056 1.7033 1.7011 1.6991 1.6973 0.975 12.7062 4.3027 3.1824 2.7764 2.5706 2.4469 2.3646 2.3060 2.2622 2.2281 2.2010 2.1788 2.1604 2.1448 2.1314 2.1199 2.1098 2.1009 2.0930 2.0860 2.0796 2.0739 2.0687 2.0639 2.0595 2.0555 2.0518 2.0484 2.0452 2.0423 0.99 31.8205 6.9646 4.5407 3.7469 3.3649 3.1427 2.9980 2.8965 2.8214 2.7638 2.7181 2.6810 2.6503 2.6245 2.6025 2.5835 2.5669 2.5524 2.5395 2.5280 2.5176 2.5083 2.4999 2.4922 2.4851 2.4786 2.4727 2.4671 2.4620 2.4573 0.995 63.6567 9.9248 5.8409 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693 3.1058 3.0545 3.0123 2.9768 2.9467 2.9208 2.8982 2.8784 2.8609 2.8453 2.8314 2.8188 2.8073 2.7969 2.7874 2.7787 2.7707 2.7633 2.7564 2.7500
© Copyright 2024