Data una popolazione, si vuole stimare un parametro di quella

INFERENZA STATISTICA: INTERVALLI DI CONFIDENZA
Data una popolazione, si vuole stimare un parametro di quella popolazione, per
esempio la media (del peso della popolazione) o la percentuale ( o proporzione)
della popolazione che pensa di votare per il candidato A.
Fare un censimento dell'intera popolazione per stimare i parametri che interessano
sarebbe troppo costoso e richiederebbe molto tempo.
L'inferenza statistica permette di STIMARE un parametro della popolazione
estraendo campioni della popolazione stessa e, calcolando, il parametro scelto ( es. la
media) sui campioni estratti.
Non tutti i parametri statistici sono stimati "bene" procedendo in questo modo , ma
la media \i della popolazione è ben stimata dalla media x del campione e la
proporzione p della popolazione è "ben stimata" dalla proporzione p del
campione.
ATTENZIONE: da una popolazione si possono estrarre più campioni, ma al variare
del campione in esame cambia anche la stima della media o della proporzione della
popolazione stessa dato che non escono sempre gli stessi dati.
PROPRIO perché, ogni volta, cambia il campione estratto, la stima della media della
popolazione è incerta e si deve introdurre l'errore standard che si indica con e».
SE n è la numerosità del campione, L'ERRORE STANDARD DELLA MEDL\'
= ,—- dove <r è la deviazione standard.
Volendo stimare il parametro sconosciuto , bisogna verificare che n>30.
In tal caso si può determinare un intervallo in cui si confida con una certa precisione
( es. al 95%) che possa essere contenuto il parametro sconosciuto:
X - k * es ; X + k * Bg]
livello di confidenza
k=
90%
1,645
95% 99% 99,74%
1,96 2,58
3a
99,99%
3,29
costruire un intervallo di confidenza al 95%, per la media della popolazione, significa
che avendo estratto numerosi campioni dalla popolazione, nel 95% dei casi circa, si
può confidare che sia contenuto il valore sconosciuto che dobbiamo stimare.
NEL CASO DELLA PROPORZIONE p, l'errore standard si determina facendo
l'intervallo di confidenza per la proporzione, che contiene il valore da stimare che è
sconosciuto, si può determinare se n>30 ed è
;p-k*es ;p + k*esj
,
Unità 1 4
Richiami e compiementi di statistica in una variabile
Distribuzione normale e Introduzione all'inferenza
Si sono eseguite delle misure della concentrazione di un farmaco nei sangue di un paziente e si è ottenuta una concentrazione media di 4 ng/ml con una deviazione standard di 0,15 pg/ml. Supponendo che le varie misure sono distribuite normalmente, individua un interv'aUo entro cui cadono circa il 95% delle rnisure effettuate,
s
|3,7 p.g/mì < X < 4,3 ^glml essendo .x una gencric-a misura?ioFHÌ
Si sono eseguite varie misurazioni di una certa limghezza e si è ottenuta una lunghezza media di 5,4 cm con una deviazione standard di 0,2 cm. Supponendo che le varie misure sono distribuite normalmente, individua un intervallo entro cui cadono circa il 90% delle misure effettuate.
[5,1 cm < x < 5,7 cm essendo x mm generica inisurazionei
^ 9 Una azienda produce bulloni, di diametro medio n incognito. Il diametro medio
di un lotto di 100 bulloni è risultato di 2,5 cm, con deviazione standard di 0,1 cm. Determina un intervallo di confidenza per ^, al livello del 95%.
12,48 cm< ti <2,52 cm]
laai In un campione dì 500 persone di una data popolazione si è osservata una statura media di 175 cm, con deviazione
standard dì 5 cm. Determinare l'intervallo di confidenza al 90% della statura media h della popolazione.
Un cali center ha calcolato il tempo medio della durata delle telefonate su un campione di 150 telefonate. Il tempo medio delle telefonate nel campione è risultato di 6 min con deviazione standard di 2 min.
Determina un intervallo dì confidenza al 95% per la durata media fj, delle telefonate che arrivano al cali center.
|5,6 min < p < 6,3 minj
I
EEi In un seggio elettorale sono state scrutinate 250 schede e si è ottenuto che in 60 di esse è espresso U voto per im dato partito. A un livello di confidenza del 95%, quale è la percentuale p di voti ottenuta dal partito? ( IS,7*'i. p < 29,3<>'oJ
Ai fini di sperimentare un nuovo farmaco, 200 individui vengono sottoposti a una terapia con tale farmaco e 80 di
essi guariscono dalla patologia per cui il farmaco è stato formulato. A im livello di confidenza del 95%, qual è la percentuale p di malati che il farmaco guarisce?
|33,2% < |> < 46,8%i
E l In un campione di 150 articoli prodotti da ima azienda, 10 sono risultati difettosi. A un livello dì confidenza del
99% qual è la percentuale/? dì artìcoli difettosi?
n,9%j
Una azienda che produce lampadine dichiara che la durata media
di un certo tipo di lampadine è di 785 ore. Una verìfica effettuata su un
campione di 150 lampadine ha dato come esito una durata media di
780 ore, con una deviazione standard di 10 ore. A un livello dì confidenza dèi 95%, può ritettersì veritiero quanto dichiarato dàll'aaéndà?
La durata media di una batteria è dichiarata di 600 ore. Una verifica effettuata su un campione di 100 batterie ha
dato come esito una durata media dì 590 ore, con ima deviazione standard di 20 ore. A un livello di confidenza del 95%,
pup ritenersi veritiero quanto dichiarato dall'azienda?
E U Una casa farmaceutica afferma che un antidolorifico di sua produzione impiega in media 22 minuti per agire. In
base alle analisi effettuate su un campione di 50 pazienti, il beneficio è stato ottenuto in media in 23 minuti con una
deviazione standard dì 8 minuti. A un livello dì confidenza del 99%, può ritenersi veritiero quanto dichiarato dall'azienda?
iSìi
Abbiamo rilevato i costi sostenuti per le vacanze SS!7V^AA
estive da 200 famiglie, costituite da due genitori
e un figlio di cinque anni, e la media è risultata
di € 2100, con una deviazione standard di € 400.
Assumendo che la distribuzione dei costi sia normale, determina il numero di famiglie che hanno
speso meno di € 1700. Quante famiglie hanno
speso più di € 1300?
[32; 195]
Per l'assunzione di nuovi dipendenti un'impresa effettua una preselezione mediante test con
domande a risposta multipla. Per esperienza si sa
che i punteggi sono distribuiti in modo gaussiano con una media di 80 e una deviazione standard di 12. Per avere la possibilità di accedere al
colloquio, occorre ottenere almeno 104 punti.
Se a una selezione i candidati sono 300, qual è
il numero di coloro che hanno superato il test e
possono cosi accedere al colloquio?
[7]
~ ~K
0
r
€
lioo
'
I
9
Vi
b
s
/Vi
• L - i 01
t
•1
&
J
Verifica di ipotesi
L'intervallo di confidenza può essere utilizzato per stabilire se un determinato valore
ipotizzato per la media o per la percentuale di una caratteristica della popolazione può
essere accettato (o meglio «non rifiutato»).
Avendo fissato un livello di confidenza e determinato il relativo intervallo, sarà sufficiente verificare se il valore ipotizzato è contenuto o meno in esso.
In una lavorazione il tempo impiegato per l'assemblaggio di due pezzi è stato fissato in 11 minuti.
Mediante un campionamento di 40 osservazioni si è rilevato un tempo medio x=l2 minuti, con una
deviazione standard cJ = 1,5 minuti.
Determiniamo se Q tempo ipotizzato può essere accetì:ato a un livello di confidenza del 95%.
L'intervallo di confidenza è ] 11,53; 12,47[ e qmndi l'ipotesi formulata non è accettata.
'/«JRIPIGA
f^^cccT
1 Portasi
Sono stati estratti a caso 40 sacchetti di fimghi
porcini del peso nominale, riportato in etichetta, di 200 g. Il loro peso medio è di 195 g, con
una deviazione standard di 10 g. Determina l'intervallo di confidenza al 95% per il peso. Il peso
nominale riportato sull'etichetta è corretto?
[)l9l,9;198,l[;noj
Vogliamo determinare la percentu^e di alunm
di una scuola superiore che utilizza la bicicletta
per andare a scuola. Il numero dei ragazzi che
hanno risposto affermativamente è 28. Sapendo
che sono stati interpeUatì 70 studenti, determma
la stima della percentuale deUa popolazione, l'errore standard e l'intervallo di confidenza al 95%.
[40%; 0,059; ]0,284;0,516[]
In un campione di 280 persone a cui è stato somministi-ato un vaccino antiinfluenzale, 86 hanno
avuto effetti collaterali.
Determina un intervallo di confidenza al 99% per
la orazione della popolazione che potrebbe essere
soggetta a questi effetti.
[j0,236; 0,3781
Si vuole verificare se il tempo di 7 minuti assegnato per l'esecuzione di una procedura è adeguato.
I valori rilevati tramite un campione di 40 osservazioni hanno indicato una media di 8 minuti,
con una deviazione standard di 2 minuti.
Costruisci l'intervallo di confidenza con probabilità del 99,99%.
Determina se il tempo assegnato è compreso in
esso e se quindi può essere accettato.
f]6,95;9.05(;si]
Una prova di resistenza alla trazione, effettuata per 300 volte applicando pesi diversi a fdi di acciaio omogenei, ha avuto come risultato un carico di rottura distribuito con andamento normale con una media di
60,2 kg/mm^ e una deviazione standard di 0,8 kg/mm^. Determina:
a. l'intervallo che contiene il 99,74% delle prove; b. il numero di volte in cui è avvenuta una rottura fra 58,6
e 61,8 kg/mm^ c. il numero di volte in cui il filo si è spezzato per una trazione inferiore a 59,4 kg/mm^;
il. la probabilità che il filo si spezzi tra 59,4 e 61 kg/mm^.
[a) ]57,8; 62,6[; b) 286; c) 48; d) 68,27%]
Si vuole determinare la durata media del prestito dei libri di una biblioteca comunale. Dall'esame di un
campione formato da 120 casi si è rilevato che il tempo medio è 25 giorni, con una deviazione standard di
10 giorni. Determina l'intervallo di confidenza al 95% del tempo medio.
[]23,2; 26,8[]
In un ti-atto autostì-adale si è rilevato che la velocità media di 170 autovetttu-e è stata di HO km/h, con una deviazione standard di 20 km/h. Determina l'intervallo di confidenza al 99% per la velocità media. []106,04; 113,96[]
Un campione di 50 degli pneumatici presenta una carenza del 20% rispetto agli standard stabiliti. Costruisci
un intervallo di confidenza al 99% della percentuale dell'intera popolazione degli pneumatici che soddisfano gli standard. L'intervallo di confidenza conferma una carenza ipotizzata del 12%?
[)0,654; 0,946[; sì]
I
mumm H tempo più conveniente In un
campione formato da 50 lavoratori si è rilevato
che il tempo impiegato per effettuare un certo
lavoro è stato in media di 20 minuti, con una
deviazione standard di 5 minuti. Dopo un mese,
in seguito a una modifica del processo produttivo, è stata effettuata la stessa rilevazione su un
campione con uguale numerosità e si è rilevato
che il tempo mediò è stato di 19 minuti, con una
deviazione standard di 3 minuti. Determina i
due ùttervaUi dUonfldenza a livello del 95% e
prova a formulare un'ipotesi sull'efficacia della
modffica introdotta.
-f ] 18,6; 21,4!; ] 18,2; 19,8 [; la'modifica potrebbe rite-^
'--nersi positiva, non tanto per il minor \'alore medio,
ma soprattutto per una maggiore efficienza indicata
dalla diminuzione della deviazione standard]