Ch. 08 Echantillonnage

Ch. 08 Echantillonnage
I – FLUCTUATION D’ECHANTILLONNAGE ET PRISE DE
DECISION
A – Principe
On considère une expérience aléatoire de Bernoulli B dont les issues possibles sont S (succès)
ou E = S (échec).
Supposons que la fréquence théorique d'apparition de S soit p(S) = p.
€
On répète n fois cette expérience aléatoire B, chaque expérience étant indépendante des autres.
X est la variable aléatoire dénombrant le nombre de succès (évènement S) obtenus au cours de la
répétition des n épreuves.
X peut donc prendre les valeurs entières comprises entre 0 et n : X = {0 ; 1 ; 2 ; 3 … ; n-1 ; n}.
La variable aléatoire X suit donc la loi binomiale B (n ; p).
Le but est de comparer la fréquence théorique avec la fréquence observée lors de la répétition des
n épreuves.
On mesure la fréquence f d'apparition de l'évènement S (succès) sur un échantillon de taille n.
Remarque : Si l'évènement S est réalisé k fois lors de la répétition des n épreuves, on a f =
k
.
n
B - Intervalle de fluctuation au seuil de 95 %
€
Définition
On s’intéresse à un caractère de proportion p dans une population.
On prélève un échantillon aléatoire de taille n et on considère la variable aléatoire X qui désigne le
nombre d’individus de cet échantillon ayant ce caractère.
X suit la loi binomiale B (n ; p).
L’intervalle de fluctuation à 95 % de la fréquence correspondant à la variable aléatoire X est
⎡ a b ⎤
l’intervalle ⎢ ; ⎥ où :
⎣ n n ⎦
a est le plus petit entier tel que P(X ≤ a) > 0,025 ;
b est le plus petit entier tel que P(X ≤ b) ≥ 0,975 .
€
€
€
Ch. 08 Echantillonnage
1
Exemple
Dans un supermarché, 70% des produits mis en vente respectent les normes
d’étiquetage. Ainsi p = 0,7 .
Dans un chariot de plusieurs clients, on prélève au hasard 100 produits donc
n = 100 .
€
On note X n le nombre d’articles bien étiquetés lors de ce prélèvement et Fn la
proportion correspondante pour ces 100 produits.
€
€ X n suit une loi binomiale B (n ; p) avec n = 100 et p = 0,7 .
€
La table permet de déterminer l’intervalle de fluctuation à 95% de Fn :
Conclusion :
€
€
€
€
C - Intervalle de fluctuation asymptotique au seuil de
95 %
Propriété
Soit X une variable aléatoire suivant la loi binomiale B (n ; p), p ∈ ]0 ; 1[ .
⎡
p(1 − p)
p(1 − p) ⎤
L’intervalle I = ⎢ p −1,96
; p +1,96
⎥ est l’intervalle de fluctuation
n
n € ⎦
⎣
asymptotique au seuil de 95% de la variable aléatoire F =
X
.
n
€
Remarque
€
On considère que l'approximation effectuée avec l'intervalle I est valable si :
ü n ≥ 30
ü np ≥ 5
€
€
€
€
ü n(1 − p) ≥ 5
Exemple
Avec p = 0,7 et n = 100 , np ≥ 5 et n(1 − p) ≥ 5 .
Les bornes de l’intervalle sont :
€
€
€
Avec une probabilité proche de 95%, le prélèvement dans les chariots fournira entre 61% et 80%
d’articles correctement étiquetés.
Ch. 08 Echantillonnage
2
Exemple : Contrôle de qualité
On effectue un contrôle de qualité sur des appareils électroniques.
On considère que la qualité de fabrication est satisfaisante si au maximum 10% des appareils sont
défectueux.
On note X la variable aléatoire donnant le nombre d'appareils défectueux.
La production journalière est de 1000 appareils et on admet que la fabrication de chaque appareil est
indépendante des autres.
Déterminer les paramètres de la loi de probabilité de X puis l'intervalle de fluctuation asymptotique
pour la proportion d'appareils défectueux au seuil de 95%.
Ch. 08 Echantillonnage
3
D – Décision à partir de la fréquence d’échantillon
On observe la fréquence f dans un échantillon de la population.
On note I l'intervalle de fluctuation asymptotique au seuil de 95%.
On émet l'hypothèse suivante : "La proportion du caractère dans (toute) la population est p"
ü Si f ∈ I alors on peut considérer que l'hypothèse formulée est vraie au seuil de confiance de
95%.
ü Si f ∉ I alors on peut considérer que l'hypothèse formulée est fausse avec un risque d'erreur
de 5%.
Exemple : prise de décision
Avec les données de l'exemple précédent, on effectue un contrôle qualité sur 100 appareils et il y en
a 9 de défectueux.
Peut-on affirmer que la qualité de fabrication est satisfaisante au seuil de confiance de 95% ?
Ch. 08 Echantillonnage
4
II – ESTIMATION ET INTERVALLE DE CONFIANCE
A- Estimation ponctuelle
Le problème de l'estimation est l'inverse de celui de l’échantillonnage.
On étudie la proportion f d'un caractère dans un échantillon et l'estimation consiste à déterminer la
proportion p de ce caractère à partir de cet échantillon.
Remarque
Pour rappel, dans la partie 1, on connait la proportion p dans la population totale et on souhaite
déterminer si l'échantillon est conforme avec un seuil de confiance de 95%.
Exemple
Sur 980 conducteurs français interrogés, 850 sont prêts à utiliser des agro carburants. Une
estimation ponctuelle de la proportion p des conducteurs français prêts à utiliser des agro carburants
est f =
€
850
≈ 0,87 , soit 87%.
980
B- Intervalle de confiance au niveau de confiance 0,95
Définition
Si on note f la fréquence observée d'un caractère dans un échantillon de taille n alors
⎡
1
1 ⎤
; f+
l'intervalle ⎢ f −
⎥ est l'intervalle de confiance de la proportion de ce caractère dans
⎣
n
n ⎦
la population totale au niveau de confiance 95%.
Cela signifie que la proportion p du caractère dans la population totale est, dans cet intervalle, avec
€ probabilité supérieure ou égale à 0,95.
une
Comme pour l'intervalle de fluctuation, il faut :
ü n ≥ 30
ü np ≥ 5
€
€
€
ü n(1 − p) ≥ 5
Exemple
Un intervalle de confiance de la proportion p des conducteurs prêts à utiliser des biocarburants au
niveau de confiance 0,95 est :
Ch. 08 Echantillonnage
5