Chapitre XI : Echantillonnage et intervalle de fluctuation Extrait du programme : I. Présentation du problème Dans une population, on suppose qu’un caractère est présent dans la proportion p. Pour juger de cette hypothèse, on prélève au hasard et avec remise, un échantillon de taille n et on observe la fréquence du caractère étudié f égale au nombre d’individus ayant ce caractère divisé par n. On cherche à savoir pour quelles valeurs de f on pourra considérer que l’hypothèse de la proportion p peut être validée ou inversement pour quelles valeurs de f on pourra considérer qu’elles sont suffisamment éloignées de p pour rejeter l’hypothèse. II. Intervalle de fluctuation Le tirage au hasard dans la population d’un individu qui peut présenter le caractère C étudié avec une probabilité p est une épreuve de Bernoulli de paramètre p, où le succès S est l’issue : « avoir C ». Le prélèvement au hasard d’un échantillon de taille n dans cette population s’assimile à un schéma de Bernoulli de paramètre n et p et la variable aléatoire X, qui compte le nombre de succès, c’est-à-dire le nombre d’individus présentant le caractère C, suit la loi binomiale b(n ;p). Les valeurs prises par la variable X (entiers entre 0 et n) sont partagées en trois intervalles [0 ; a – 1] , [a ; b] et [b +1 ; n] de façon que X prenne ses valeurs dans chacun des deux intervalles extrêmes avec une probabilité proche de 2,5 % sans jamais la dépasser. Définition : a b L’intervalle de fluctuation au seuil de 95% de la fréquence observée est l’intervalle n;n où : - a est le plus petit entier tel que P(X≤ a) > 0,025 b est le plus petit entier tel que (X≤ b) > 0,975 Remarque : X prenant des valeurs entières : donc P (a ≤ X ≤ b ) = P (X ≤ b ) − P (X ≤ a – 1 ) on déduit de la définition que : P (X ≤ a – 1 ) ≤ 0, 025 – P (X ≤ a – 1 ) ≥ − 0, 025 donc P (a ≤ X ≤ b ) ≥ 0,975 – 0,025 soit P (a ≤ X ≤ b ) ≥ 0,95 = 95 % III. Prise de décision Si f [ a ; b ] , alors on ne peut pas rejeter l’hypothèse selon laquelle la proportion du caractère est n n égale à p. Si f [ a ; b ] , alors on rejette cette hypothèse au risque d’erreur de 5% n n (ce qui veut dire que la probabilité de rejeter l’hypothèse alors qu’elle est vraie est inférieure à 5%) Point-méthode 30 : Prendre une décision avec un intervalle de fluctuation Un candidat à une prochaine élection pense que 54% des électeurs lui apporteront leur voix. 1. Un sondage réalisé auprès de 100 électeurs (le choix des électeurs est assimilé à un tirage au hasard et avec remise) et on note f la fréquence, dans cet échantillon, des personnes qui voteront pour le candidat. On observe que, sur les 100 électeurs interrogés, 45 déclarent voter pour le candidat. Considère-t-on alors l’affirmation du candidat exacte ou non ? 2. Un autre sondage est réalisé par son concurrent, auprès de 200 électeurs. On observe alors que, sur les 200 électeurs interrogés, 90 déclarent voter pour le candidat. Considère-t-on alors l’affirmation du candidat exacte ou non ? Solution : 1. - On identifie les différentes valeurs : - n = 100 f = 0,45 p On commence par définir une variable aléatoire, et donner les paramètres de la loi binomiale qu’elle suit : Soit X la variable aléatoire comptant le nombre d’électeur allant voter pour le candidat parmi les 100. On répète alors 100 fois de façon identique et indépendante une épreuve de Bernoulli (demander son opinion à un électeur), dont la probabilité de succès (l’électeur vote pour le candidat) est 0,54. Alors X~b(100 ;0,54) - On va réaliser à la calculatrice, l’ensemble des calculs de P(X≤ k) pour k allant de 0 à 100. Dans f ( x ) : Y1 = BinomFRep(n ,p ,X) ici Y1 = BinomFRep(100,0.54,X) Puis on regarde le tableur à partir de 0 avec un pas de 1. On lit dans cette table, la première valeur qui arrive au-dessus de 0,025 ainsi que la 1ère au-dessus de 0,975. On doit donner pour chaque cas, la valeur précédente pour justifier qu’il s’agit bien de la 1ère au-dessus. P(X≤ 43) 0,018 P(X≤ 44) 0,0285 > 0,025 donc a = 44 P(X ≤ 63) 0,972 P(X ≤ 64) 0,9831 > 0,975 donc b = 64 44 64 Ainsi, l’intervalle de fluctuation au seuil de 95% de f est l’intervalle 100;100 = [0,44 ;0,64]. Une fois l’intervalle de fluctuation trouvé, on regarde si f est dedans ou non : - Si f n’est pas dedans, alors on peut rejeter l’hypothèse faite sur p - Si f est dedans, on ne peut pas rejeter cette hypothèse. Ici f = 0,45 donc f [0,44 ;0,64]. Ainsi, on ne peut pas rejeter l’hypothèse faite par le candidat que 54% des électeurs apporteront leur voix. 2. Il s’agit de la même expérience, mais répétée 200 fois, donc X~b(200 ;0,54) n = 200 f = 0,45 p On change la fonction : Y1 = BinomFRep(200,0.54,X) P(X≤ 93) 0,0199 P(X≤ 94) 0,027> 0,025 donc a = 94 P(X ≤ 121) 0,973 P(X ≤ 122) 0,9806 > 0,975 donc b = 122 94 122 Ainsi, l’intervalle de fluctuation au seuil de 95% de f est l’intervalle 200;200 = [0,47 ; 0,61] Or f = 0,45 [0,47 ;0,61] donc on peut rejeter l’hypothèse faite par le candidat, avec un risque d’erreur de 5%.
© Copyright 2024