Ch. 08 Echantillonnage I – FLUCTUATION D’ECHANTILLONNAGE ET PRISE DE DECISION A – Principe On considère une expérience aléatoire de Bernoulli B dont les issues possibles sont S (succès) ou E = S (échec). Supposons que la fréquence théorique d'apparition de S soit p(S) = p. € On répète n fois cette expérience aléatoire B, chaque expérience étant indépendante des autres. X est la variable aléatoire dénombrant le nombre de succès (évènement S) obtenus au cours de la répétition des n épreuves. X peut donc prendre les valeurs entières comprises entre 0 et n : X = {0 ; 1 ; 2 ; 3 … ; n-1 ; n}. La variable aléatoire X suit donc la loi binomiale B (n ; p). Le but est de comparer la fréquence théorique avec la fréquence observée lors de la répétition des n épreuves. On mesure la fréquence f d'apparition de l'évènement S (succès) sur un échantillon de taille n. Remarque : Si l'évènement S est réalisé k fois lors de la répétition des n épreuves, on a f = k . n B - Intervalle de fluctuation au seuil de 95 % € Définition On s’intéresse à un caractère de proportion p dans une population. On prélève un échantillon aléatoire de taille n et on considère la variable aléatoire X qui désigne le nombre d’individus de cet échantillon ayant ce caractère. X suit la loi binomiale B (n ; p). L’intervalle de fluctuation à 95 % de la fréquence correspondant à la variable aléatoire X est ⎡ a b ⎤ l’intervalle ⎢ ; ⎥ où : ⎣ n n ⎦ a est le plus petit entier tel que P(X ≤ a) > 0,025 ; b est le plus petit entier tel que P(X ≤ b) ≥ 0,975 . € € € Ch. 08 Echantillonnage 1 Exemple Dans un supermarché, 70% des produits mis en vente respectent les normes d’étiquetage. Ainsi p = 0,7 . Dans un chariot de plusieurs clients, on prélève au hasard 100 produits donc n = 100 . € On note X n le nombre d’articles bien étiquetés lors de ce prélèvement et Fn la proportion correspondante pour ces 100 produits. € € X n suit une loi binomiale B (n ; p) avec n = 100 et p = 0,7 . € La table permet de déterminer l’intervalle de fluctuation à 95% de Fn : Conclusion : € € € € C - Intervalle de fluctuation asymptotique au seuil de 95 % Propriété Soit X une variable aléatoire suivant la loi binomiale B (n ; p), p ∈ ]0 ; 1[ . ⎡ p(1 − p) p(1 − p) ⎤ L’intervalle I = ⎢ p −1,96 ; p +1,96 ⎥ est l’intervalle de fluctuation n n € ⎦ ⎣ asymptotique au seuil de 95% de la variable aléatoire F = X . n € Remarque € On considère que l'approximation effectuée avec l'intervalle I est valable si : ü n ≥ 30 ü np ≥ 5 € € € € ü n(1 − p) ≥ 5 Exemple Avec p = 0,7 et n = 100 , np ≥ 5 et n(1 − p) ≥ 5 . Les bornes de l’intervalle sont : € € € Avec une probabilité proche de 95%, le prélèvement dans les chariots fournira entre 61% et 80% d’articles correctement étiquetés. Ch. 08 Echantillonnage 2 Exemple : Contrôle de qualité On effectue un contrôle de qualité sur des appareils électroniques. On considère que la qualité de fabrication est satisfaisante si au maximum 10% des appareils sont défectueux. On note X la variable aléatoire donnant le nombre d'appareils défectueux. La production journalière est de 1000 appareils et on admet que la fabrication de chaque appareil est indépendante des autres. Déterminer les paramètres de la loi de probabilité de X puis l'intervalle de fluctuation asymptotique pour la proportion d'appareils défectueux au seuil de 95%. Ch. 08 Echantillonnage 3 D – Décision à partir de la fréquence d’échantillon On observe la fréquence f dans un échantillon de la population. On note I l'intervalle de fluctuation asymptotique au seuil de 95%. On émet l'hypothèse suivante : "La proportion du caractère dans (toute) la population est p" ü Si f ∈ I alors on peut considérer que l'hypothèse formulée est vraie au seuil de confiance de 95%. ü Si f ∉ I alors on peut considérer que l'hypothèse formulée est fausse avec un risque d'erreur de 5%. Exemple : prise de décision Avec les données de l'exemple précédent, on effectue un contrôle qualité sur 100 appareils et il y en a 9 de défectueux. Peut-on affirmer que la qualité de fabrication est satisfaisante au seuil de confiance de 95% ? Ch. 08 Echantillonnage 4 II – ESTIMATION ET INTERVALLE DE CONFIANCE A- Estimation ponctuelle Le problème de l'estimation est l'inverse de celui de l’échantillonnage. On étudie la proportion f d'un caractère dans un échantillon et l'estimation consiste à déterminer la proportion p de ce caractère à partir de cet échantillon. Remarque Pour rappel, dans la partie 1, on connait la proportion p dans la population totale et on souhaite déterminer si l'échantillon est conforme avec un seuil de confiance de 95%. Exemple Sur 980 conducteurs français interrogés, 850 sont prêts à utiliser des agro carburants. Une estimation ponctuelle de la proportion p des conducteurs français prêts à utiliser des agro carburants est f = € 850 ≈ 0,87 , soit 87%. 980 B- Intervalle de confiance au niveau de confiance 0,95 Définition Si on note f la fréquence observée d'un caractère dans un échantillon de taille n alors ⎡ 1 1 ⎤ ; f+ l'intervalle ⎢ f − ⎥ est l'intervalle de confiance de la proportion de ce caractère dans ⎣ n n ⎦ la population totale au niveau de confiance 95%. Cela signifie que la proportion p du caractère dans la population totale est, dans cet intervalle, avec € probabilité supérieure ou égale à 0,95. une Comme pour l'intervalle de fluctuation, il faut : ü n ≥ 30 ü np ≥ 5 € € € ü n(1 − p) ≥ 5 Exemple Un intervalle de confiance de la proportion p des conducteurs prêts à utiliser des biocarburants au niveau de confiance 0,95 est : Ch. 08 Echantillonnage 5
© Copyright 2024