LES TESTS D'HYPOTHÈSES Il s'agit à partir de l'étude d'un ou plusieurs échantillons, de prendre des décisions concernant la population mère. 1 Test bilatéral sur la moyenne 1.1 Le problème Reprenons l'exercice 1 du chapitre précédent : Une société fournit des pièces devant peser 780 g. Sur 500 pièces fabriquées on en prélève 36. Masse Nombre de pièces [745 ; 755[ [755 ; 765[ [765 ; 775[ [775 ; 785[ [785 ; 795[ [795 ; 805[ 2 6 10 11 5 2 On désire savoir si les 500 pièces ont bien une masse moyenne de 780 g, pour accepter ou refuser la livraison. Dans l'échantillon la masse moyenne était de 774,7 g ; peut on en conclure que la masse moyenne des 500 pièces n'est pas 780 g ? 1.2 Construction d'un test ] Le fabricant des pièces arme que la moyenne est de 780 g et l'écart type de 12,5. ] Soit On suppose que la moyenne est de 780 g ; c'est l'hypothèse nulle, on la note H0 : m = 780. L'hypothèse alternative, notée H1 est : m 6= 780. X la variable aléatoire qui à chaque échantillon de taille D'après le théorème de la limite centrée, m = 780, σ = 12, 5 Dans notre cas, ] et X associe sa moyenne. suit approximativement la loi normale n = 36 Supposons que nous voulons un intervalle On dit que l'on fait un test au n donc I X suit approximativement centré en m tel que N σ m; √ n . N (780; 2, 08). P (X ∈ I) = 0, 95. seuil de conance 0,95 ou au seuil de signication (ou seuil de risque ) 0,05. On cherche donc h tel que La calculatrice nous donne P (X ∈ [780 − h; 780 + h]) = 0, 95 h ' 4, 076. D'où l'intervalle I = [775, 92; 784, 08]. m = 780, on sait avant de prélever l'échantillon [775, 92 ; 784, 08] avec une probabilité de 0,95. Donc si valle ] On en tire la Soit xe que sa moyenne appartiendra à l'inter- Règle de décision suivante : la moyenne de l'échantillon. Si Si xe ∈ [775, 92 ; 784, 08] xe 6∈ [775, 92 ; 784, 08] Dans notre cas alors on valide alors on rejette xe = 774, 7 6∈ [775, 92 ; 784, 08] H0 . H0 . donc on rejette 1 H0 ; La livraison est refusée. A.B Vauban À savoir 1. Test bilatéral sur la moyenne au seuil de signication α On désire savoir si la moyenne de la population est égale à À On xe les hypothèses : m0 . H0 : m = m 0 . Hypothèse alternative, H1 : m 6= m0 . X qui, à chaque échantillon de taille n associe sa moyenne Á La variable aléatoire σ suit N m0 , √ n  On cherche h à la calculatrice tel que P (X ∈ [m0 − h; m0 + h]) = 1 − α On note Iα = [m0 − h; m0 + h] à Règle de décision : Soit xe la moyenne de l'échantillon. Si xe ∈ Iα alors on accepte H0 . Si xe 6∈ Iα alors on rejette H0 . Hypothèse nulle, Le test est dit bilatéral car la région critique se trouve des deux côtés du domaine d'acceptation de H0 . région d'acceptation de H0 région critique région critique α 2 m0 − h Remarque α 2 1−α m0 + h : Il faut bien faire la diérence entre intervalle de conance de la moyenne et intervalle d'acceptation d'un test de validité d'hypothèse. Intervalle de conance de la moyenne : On calcule la moyenne sur l'échantillon et on en déduit un intervalle contenant la moyenne de la population mère. Intervalle d'acceptation de H0 : On suppose la valeur de la moyenne sur la population mère et on en déduit un intervalle devant contenir la moyenne de l'échantillon. 1.3 Remarques sur le seuil de risque H0 alors que H0 est vraie, c'est l'erreur de première espèce. Dans notre exemple, avec α = 0, 01, l'ntervalle d'acceptation de H0 serait [774, 62 ; 785, 38]. Ce qui veux dire, qu'au seuil de risque 0,01, H0 aurait été acceptée. Mais en diminuant α on augmente un autre risque, celui d'accepter H0 alors que H0 est fausse ; c'est l'erreur de seconde espèce, de probabilité notée β . Le problème est que, pour n xé, si on diminue α on augmente β . La seule façon de baisser les deux est d'augmenter n. La probabilité 1 − β est α est la probabilité de rejeter appelée la puissance du test. L'erreur de première espèce est le risque fournisseur (risque de se voir refuser une livraison de bonnes pièces). L'erreur de seconde espèce est le risque client (risque d'accepter un lot de mauvaises pièces). 2 A.B Vauban Hypothèse vraie H0 Hypothèse acceptée H1 H0 H1 Pas derreur Erreur de seconde espèce Probabilité 1−α Erreur de première espèce Probabilité α Probabilité β Pas d'erreur Probabilité 1−β α. signicatif : α = 0, 05. très signicatif : α = 0, 01. hautement signicatif : α = 0, 001. Dans la pratique on se xe test test test 2 Test unilatéral sur la moyenne Reprenons notre problème précédent. Si le client considère que la masse des pièces ne doit pas être inférieure à 780 g alors on prendra comme hypothèse alternative : H1 : m < 780. Dans d'autre cas nous pourrions prendre m > 780. Dans un test unilatéral la région critique se trouve d'un seul côté du domaine d'acceptation de H0 . Attention, l'hypothèse nulle H0 est toujours une égalité. 2.1 Test unilatéral à droite Gardons le seuil de signication ] Les hypothèses sont : ] Comme précédemment 0, 05 Hypothèse nulle : H0 , m = 780 Hypothèse alternative : H1 , m < 780 X suit approximativement On détermine, à la calculatrice, le nombre On trouve ] tel que P (X 6 a) = 0, 05. a ' 776, 58 Règle de décision du test : Soit xe la moyenne de l'échantillon. Si xe > 776, 58 alors on valide Sinon, on valide ] a N (780; 2, 08). H1 , H0 H0 est rejetée. Conclusion : dans notre exemple, xe = 774, 7 donc on rejette H0 . À savoir 2. Test unilatéral à droite sur la moyenne au seuil de signication α À On xe les hypothèses : H0 : m = m 0 . Hypothèse alternative, H1 : m < m0 . Á La variable aléatoire X qui, à chaque échantillon de taille n σ suit N m0 , √ n  On cherche a à la calculatrice tel que P (X 6 a) = α à Règle de décision : Soit xe la moyenne de l'échantillon. Si xe > a alors on accepte H0 . Sinon on rejette H0 . Hypothèse nulle, 3 associe sa moyenne A.B Vauban région d'acceptation de H0 région critique α 1−α a 2.2 Test unilatéral à gauche À savoir 3. Test unilatéral à gauche sur la moyenne au seuil de signication α À On xe les hypothèses : H0 : m = m 0 . Hypothèse alternative, H1 : m > m0 . Á La variable aléatoire X qui, à chaque échantillon de taille n σ suit N m0 , √ n  On cherche a à la calculatrice tel que P (X 6 a) = 1 − α à Règle de décision : Soit xe la moyenne de l'échantillon. Si xe 6 a alors on accepte H0 . Sinon on rejette H0 . Hypothèse nulle, région d'acceptation de associe sa moyenne H0 région critique α 1−α a Exercice 1 Un fabricant d'ampoules livre un lot de 1000 ampoules. il annonce une durée de vie moyenne de 1120 heures. L'écart type est σ = 120. On teste 36 ampoules et on trouve une durée de vie moyenne xe = 1102. Construire un test unilatéral au seuil de risque 5 % et l'appliquer. 3 Test bilatéral de comparaison de deux moyennes P1 et P2 . On désire déterminer m2 des deux populations. On considère deux échantillons prélevés sur deux populations s'il y a une diérence signicative entre les moyennes Exercice 2 m1 et Deux groupes d'étudiants A et B passent un examen. On prélève 25 élèves dans le groupe A et 30 dans le groupe B, on trouve SA = 2, 5 et xA = 10, 5 ; xB = 11 ; SB = 2, 8. On désire savoir, en se xant un seuil de risque de 5 % , s'il y a une diérence signicative entre les moyennes des deux groupes. 4 A.B Vauban 1) a) Donner une estimation ponctuelle des écarts types XA b) On désigne par et σB à 10−2 près. la variable aléatoire qui, à chaque échantillon de 25 étudiants du XA groupe A, associe sa moyenne . On admet que XB On désigne par σA suit la loi normale N (mA , σA ). la variable aléatoire qui, à chaque échantillon de 30 étudiants du XB suit la loi normale N (mB , σB ). On note D la variable aléatoire dénie par D = XA − XB . On admet que D suit une loi normale de moyenne mA − mB et d'écart type r σA2 σ2 + B . Donner une valeur approchée de σ à 10−2 près. σ= 25 30 groupe B, associe sa moyenne . On admet que 2) Construction du test On choisit comme hypothèse nulle : H0 : mA = mB et comme hypothèse alternative H1 : mA 6= mB . H0 , D suit la loi normale N (0, σ). réel t tel que P (−t 6 D 6 t) = 0, 95. (a) Sous l'hypothèse Déterminer le (b) Énoncer la règle de décision du test. 3) Conclure. 4 Tests sur les proportions à l'aide d'une loi binomiale Un candidat A à une élection arme que 52 % des électeurs veulent voter pour lui. Un sondage sur 100 électeurs pris au hasard donne une proportion de 0,43 de votes favorables au candidat A. Peut on en conclure que le candidat ment ? ] Choix des hypothèses : Nous allons faire un test bilatéral en prenant comme hypothèse que le candidat dit vrai. Soit p la proportion d'électeurs désirant voter pour A. Hypothèse nulle : H0 , p = 0, 52 Hypothèse alternative : H0 , p 6= 0, 52 ] On suppose que dans la population des électeurs, Soit la variable aléatoire X p = 0, 52. comptant le nombre de personnes dé- clarant voter pour A sur 100 personnes interrogées. X suit la loi binomiale B(100; 0, 52). On se xe un seuil de signication de 0,05. B(100; 0, 52) a et b tels que : P (X 6 a) > 0, 025 et P (X 6 b) > 0, 975. On trouve a = 42 et b = 62. On a donc : P (X ∈ [42; 62]) > 0, 95. A l'aide du tableau ci-contre de la loi on détermine les plus petits entiers Les échantillons comportant 100 personnes, en divisant par 100 on obtient l'intervalle de uctuation à environ 95 % proportion d'électeurs déclarant voter pour A : ] de la B(100; 0, 52) k P (X 6 k) 40 0, 0106 41 0, 0177 42 0, 0286 43 0, 0444 ··· ··· 61 0, 9719 62 0, 9827 63 0, 9897 64 0, 9941 [0, 42; 0, 62] On en tire la règle de décision du test : f la fréquence d'électeurs votant pour Si f ∈ [0, 42 ; 0, 62] alors on valide H0 . Sinon on rejette H0 . En notant 5 A dans l'échantillon. A.B Vauban ] 5 Conclusion : Au seuil de signication 0,05 on valide H0 . Tests sur les proportions à l'aide d'une loi normale Soit un événement A ayant une fréquence Considérons un échantillon de taille n. p Soit sur la population mère. nA le nombre d'éléments de l'échantillon vériant A. La fréquence d'apparition de A sur l'échantillon est donc nA . n f= r p(1 − p) p; On admet, voir le chapitre opérations sur les variables aléatoires, que f suit la loi N n Les tests sont les mêmes que pour les moyennes, il sut donc de remplacer m par p, xe par f r σ p(1 − p) et √ par . n n Exercice 3 Dans une population on a observé que 40 % des gens sont allergiques à un médicament A. Pour tester un nouveau médicament on désire prendre un échantillon représentatif de 100 personnes. 31 révèlent une allergie à A. On désire savoir si, au seuil de risque de 5 %, l'échantillon est représentatif de la population. On note p la fréquence d'allergiques à A 1. On choisit comme hypothèse nulle dans la population. H0 : p = 0, 4 et comme hypothèse alternative H1 : p 6= 0, 4. Soit F la variable aléatoire qui, à chaque échantillon de 100 personnes, associe la fréquence de 'allergiques à A. r On admet que F Sous l'hypothèse suit la loi normale H0 N déterminer le réel p; h p(1 − p) 100 tel que ! . P (0, 4 − h 6 F 6 0, 4 + h) = 0, 95. 2. Énoncer la règle de décision du test. 3. Conclure. Exercice 4 On considère une allergie à un germe A. Premier échantillon : 300 femmes, 45 sont allergiques à A. Second échantillon : 500 hommes, 80 sont allergiques à A. On désire savoir si, au seuil de risque 5 %, il y a une diérence signicative entre les pourcentages d'allergies chez les femmes et chez les hommes ? On note pf 1. Soit et F ph les fréquences d'allergies à A chez les femmes et chez les hommes. la variable aléatoire qui, à chaque échantillon de300 femmes, associe la fréquence d'allergies à A. On admet que F suit la loi normale 6 N σf pf ; √ 300 . A.B Vauban ! . Soit H la variable aléatoire qui, à chaque échantillon de 500 hommes, associe la fréquence d'allergies à A. On admet que Calculer une estimation de H σf suit la loi normale σh et σh ph ; √ 500 N . à partir des échantillons. (Les échantillons sont susamment importants pour que l'on puisse utiliser l'estimation :σ ' p f (1 − f ) , f étant la fréquence dans l'échantillon) 2. On note D la variable aléatoire dénie par normale de moyenne Calculer ph − pf et d'écart type D =rH − F . On σf2 σh2 σ= + . 500 300 admet que D suit la loi σ. 3. On choisit comme hypothèse nulle : H0 : pf = ph et comme hypothèse alternative H1 : pf 6= ph . H0 , D suit la loi normale N (0, σ). réel t tel que P (−t 6 D 6 t) = 0, 95. Sous l'hypothèse Déterminer le 4. Énoncer la règle de décision du test. 5. Conclure. Exercice 5 Nouvelle Calédonie 2011 8 points On considère un stock de pièces de rechange pour les machines-outils d'une grande entreprise. Dans cet exercice, les résultats approchés sont à arrondir à 10−2 (sauf mention particulière) 1. Le tableau suivant récapitule la consommation mensuelle d'un certain modèle de roulements à billes, pour les 11 mois travaillés de l'année dernière. Mois Janvier Février Mars Avril Mai Juin Quantité 20 30 25 15 25 10 Mois Juillet Septembre Octobre Novembre Décembre Quantité 35 42 25 35 15 Déterminer la moyenne 2. On désigne par X x σ et l'écart type de cette série statistique. la variable aléatoire qui, à un mois travaillé pris au hasard dans l'année à venir, associe la consommation du type de roulements à billes considéré au 1. On suppose que X suit la loi normale de moyenne (a) Calculer Le nombre entier 5% et d'écart type 9, 5. P (14, 5 6 X 6 35, 5). (b) Déterminer le nombre réel à 25 n, k P (X 6 k) = 0, 95. arrondissant k par excès, tel que obtenu en est appelé stock d'alerte pour la pièce considérée. 3. Le délai de livraison d'un certain type de transformateur est de 20 jours. On admet que la variable aléatoire Y qui, à une période de 20 jours prise au hasard dans l'année à venir, associe le nombre de transformateurs de ce type, mis en service pendant cette période, suit la loi de Poisson de paramètre (a) Calculer P (Y 6 5) et λ = 3. P (Y 6 6). (b) En déduire le stock d'alerte à 5 % pour ce type de transformateur, c'est -à-dire le plus petit entier a tel que P (y 6 a) > 0, 95. 7 A.B Vauban 4. Pour réapprovisionner le stock d'un certain type de joints circulaires, on eectue une commande en grande quantité. Le fabriquant garantit des joints de 30 mm de diamètre, σ=1 avec un écart type mm. Il est convenu de procéder, à la réception, à un contrôle de qualité à l'aide d'un test d'hypothèse bilatéral de la moyenne, sur un échantillon aléatoire de 64 joints. On désigne par Z la variable aléatoire qui, à chaque échantillon aléatoire de 64joints prélevés dans le lot reçu, associe la moyenne des diamètres en millimètres des joints de cet échantillon (le lot est susamment important pour qu'on puisse assimiler ces prélèvements à des tirages avec remise). L'hypothèse nulle est H0 : L'hypothèse alternative est µ = 30 . H1 : µ 6= 30 . Le seuil de signication du test est xé à 0, 05. (a) Sous l'hypothèse H0 , on considère que σ √ . 64 type Z suit la loi normale de moyenne Déterminer, sous cette hypothèse, le nombre réel h 30 et d'écart positif tel que : P 30 − h 6 Z 6 30 + h = 0, 95. Arrondir h à 10−3 . (b) En déduire la règle de décision permettant d'utiliser ce test. (c) Sur l'échantillon de 29, 8 64 joints prélevés dans le lot reçu, on trouve une moyenne de mm pour les diamètres. Indiquer si le lot est accepté en utilisant la règle de décision de la question précédente. Exercice 6 Métropole 2013 8 points Les quatre parties de cet exercice peuvent être traitées de façon indépendante. Dans cet exercice, les résultats approchés sont à arrondir à 10−2 A. Loi de Poisson On désigne par X la variable aléatoire qui, a tout intervalle de temps d'une durée de 30 secondes, associe le nombre de skieurs se présentant à une remontée mécanique, entre 14 heures et 15 heures. On admet que X suit la loi de Poisson de paramètre 1. Déterminer la probabilité λ = 6. P (X = 6). 2. Calculer la probabilité que, pendant un intervalle de temps d'une durée de 30 secondes pris au hasard entre 14 heures et 15 heures, il se présente au plus 6 skieurs. B. Loi normale Une entreprise découpe une grande quantité de tubes pour le montage des remontées mécaniques. La longueur des tubes est exprimée en millimètres. Un tube est dit conforme pour la longueur lorsque celle-ci appartient à l'intervalle [245 ; 255]. On désigne par Y la variable aléatoire qui, à chaque tube pris au hasard dans la production d'une journée, associe sa longueur. 1. Après un réglage de la machine, on admet que la variable aléatoire de moyenne 250 et d'écart type Y suit la loi normale 3. Calculer la probabilité qu'un tube pris au hasard dans la production de cette journée soit conforme pour la longueur. 8 A.B Vauban 2. Le résultat obtenu au 1. n'est pas jugé satisfaisant. On décide de modier l'écart type à l'aide d'un nouveau réglage de la machine. Dans cette question, la variable aléatoire Y 250 et d'écart type σ . que P (245 6 Y 6 255) = 0, 97. suit une loi normale de moyenne σ Déterminer l'écart type pour C. Loi binomiale Dans un lot de tubes, 3 % des tubes ne sont pas conformes pour la longueur. On prélève au hasard 50 tubes de ce lot. Le lot est susamment important pour que l'on puisse assimiler ce prélèvement à un tirage avec remise de Z On considère la variable aléatoire 50 lots. qui, à tout prélèvement ainsi déni, associe le nombre de tubes qui ne sont pas conformes pour la longueur. 1. Justier que la variable aléatoire 2. Calculer la probabilité Z suit une loi binomiale dont on précisera les paramètres. P (Z = 0). 3. Calculer la probabilité que dans un tel prélèvement au moins un tube ne soit pas conforme pour la longueur. D. Test d'hypothèse On se propose de construire un test d'hypothèse pour contrôler la moyenne µ inconnue des longueurs, exprimées en millimètres, d'un lot important de tubes destinés au montage des remontées mécaniques. On désigne par L la variable aléatoire qui, à chaque échantillon aléatoire de 50 tubes prélevés au hasard dans ce lot, associe la moyenne des longueurs de ces tubes (le lot est susamment important pour que l'on puisse assimiler ces prélèvements à des tirages avec remise). H0 : µ = 250. Dans ce alternative est H1 : µ 6= 250. L'hypothèse nulle est L'hypothèse cas, on considère que le lot est conforme. Le seuil de signication du test est xé à 5 %. 1. Sous l'hypothèse nulle moyenne 250 H0 , on admet que la variable aléatoire 0, 33. P (249, 35 < L < 250, 65) = 0, 95. L suit la loi normale de et d'écart type On admet également que Ce résultat n'a pas à être démontré. Énoncer la règle de décision permettant d'utiliser ce test. 2. On prélève un échantillon aléatoire de 50 tubes dans le lot et on observe que, pour cet échantillon, la moyenne des longueurs des tubes est ` = 250, 49. Peut-on, au seuil de 5 %, conclure que ce lot est conforme ? Exercice 7 Nouvelle Calédonie 2013 8 points Les trois parties de cet exercice peuvent être traitées de façon indépendante. Dans une entreprise, deux automates programmables industriels commandent deux machines m1 et m2 qui produisent des boulons. A. Probabilités conditionnelles La machine machine m2 m1 produit 40 % des boulons de l'entreprise dont 2 % de boulons défectueux. La produit 60 % des boulons de l'entreprise dont 3 % de boulons défectueux. On prélève au hasard un boulon dans la production d'une journée. Tous les boulons ont la même probabilité d'être tirés. On considère les évènements suivants : : M2 : M1 le boulon prélevé est produit par la machine m1 . le boulon prélevé est produit par la machine m2 . 9 A.B Vauban D : le boulon prélevé est défectueux . 1. Déterminer les probabilités (On rappelle que M1 Pm1 (D) P (M1 ), P (M2 ), PM1 (D) est la probabilité de PM2 (D). l'évènement D sachant et que l'évènement est réalisé.) P (M1 ∩ D) 2. Calculer 3. En déduire que et P (M2 ∩ D). P (D) = 0, 026. PD (M1 ) que le boulon prélevé provienne de la machine M1 −2 qu'il est défectueux. Donner la valeur approchée arrondie à 10 . −2 Dans la suite de l'exercice les résultats approchés seront arrondis à 10 . 4. Calculer la probabilité sachant B. Loi binomiale et loi de Poisson On prélève au hasard 50 boulons dans un stock de I'entreprise. On considère que ce stock est susamment important pour assimiler ce prélèvement à un tirage avec remise de 50 boulons. On suppose que la probabilité qu'un boulon prélevé au hasard dans ce stock soit défectueux est 0, 03. X On note la variable aléatoire qui, à tout prélèvement ainsi déni, associe le nombre de boulons défectueux. 1. Justier que la variable aléatoire 2. X suit une loi binomiale dont on précisera les paramètres. (a) Calculer la probabilité que, dans un tel prélèvement, aucun boulon ne soit défectueux. (b) Calculer la probabilité que, dans un tel prélèvement, au plus deux boulons soient défectueux. 3. On considère que la loi de probabilité suivie par la variable aléatoire X peut être approchée par une loi de Poisson. (a) Déterminer le paramètre (b) On désigne par oÙ λ Y λ de cette loi de Poisson. une variable aléatoire suivant la loi de Poisson de paramètre est la valeur obtenue au a). Calculer λ, P (Y 6 2). C. Test d'hypothèse p inconnue des m1 durant une journée. ¯ la variable aléatoire qui, à chaque échantillon aléatoire de 50 boulons prélevés On désigne par D au hasard dans la production d'une journée de la machine m1 , associe la moyenne des diamètres On se propose de construire un test d'hypothèse pour contrôler la moyenne diamètres, exprimés en millimètres, des boulons produits par la machine de ces boulons (la production est susamment importante pour que l'on puisse assimiler ces prélèvements à des tirages avec remise). H0 : µ = 10. Dans ce cas, on considère que la machine m1 alternative est H1 : µ 6= 10. L'hypothèse nulle est L'hypothèse est bien réglée. Le seuil de signication du test est xé à 5 %. 1. Sous l'hypothèse nulle moyenne 10 H0 , et d'écart type on admet que la variable aléatoire D suit la loi normale de 0, 16. Déterminer, en utilisant cette loi normale, le nombre réel h positif tel que : P (10 − h 6 D 6 10 + h) = 0, 95. 2. Énoncer la règle de décision permettant d'utiliser ce test. 3. On prélève un échantillon aléatoire de 50 boulons dans la production d'une journée de la m1 et on observe que, pour cet échantillon, la moyenne des diamètres des boulons d¯ = 10, 2. Peut-on, au seuil de 5 % conclure que la machine m1 est bien réglée ? machine est 10 A.B Vauban
© Copyright 2024