Statistikk Forelesning III t-test Kji kvadrat test

1.
2.
3.
4.
5.
6.
7.
8.
Bestem null- og den alternative hypotesen
Velg signifikansnivå
Velg fordeling
beregn testobservatoren
Beregn frihetsgrader
Finn kritisk verdi
Formuler ”the decision rule”
Avvis eller behold nullhypotesen
Nullhypotesen er hypotesen som testes.
Refererer til null forskjell/null endring.
Derfor skal likhetstegnet (eller ≤ / ≥) alltid stå i
nullhypotesen. Eksempel:
Den alternative hypotesen er den motsatte
påstanden. Eksempel
Signifikansnivået er sannsynligheten for å
avvise nullhypotesen når den skal beholdes.
(type 1 feil)
5% brukes oftest.
Bruk lavere sannsynlighet ved høy risiko
Bruk høyere sannsynlighet ved lav risiko
Brannalarmen går for 18.000. gang på
prestvannet studentboliger denne uka
Behold Ho
Avvis Ho
Ho er sann
Du fortsetter å se på
netflix
Du går ut og fryser
for 18.000. gang
denne uka og går inn
igjen og ser på
netflix (Type I)
Ho er usann
Du brenner inne
(Type II)
Du går ut og varmer
deg på varmen fra
brannen
Fokuserer på z- og t-test for øyeblikket. Det
finnes andre fordelinger.
Bruk z-test kun hvis:
n>30 OG populasjonens standardavvik er kjent!
Bruk t-test ellers!
0.4
Sammenligning av normal og t- fordelinger
Fordelinger
0.2
0.1
0.0
Density
0.3
df=1
df=3
df=8
df=30
normal
-4
-2
0
x value
2
4
Er populasjonens
standardavvik
kjent?
Ja
Nei
Er
utvalgsstørrelsen
mer enn 30?
Ja
Nei
Bruk z-test
Bruk t-test
Bruk t-test
x = verdien vi vil teste
μ = utvalgets gjennomsnitt
s = utvalgets standardavvik
n = antall observasjoner
I
en utregning er dette antallet verdier som
kan variere
 Når vi beregner t-observatoren er det n-1
verdier som kan variere, -1 er siden
gjennomsnittet er bestemt
 Eks:

Hvis vi har 10 ukjente verdier med gjennomsnitt
30 vet vi at summen av disse verdiene må bli
300. Hvis vi beregner 9 verdier ("frie"), vil den
siste verdien være gitt
 1-hale-test
ved bruk av ≥ eller ≤
 2-hale-test ved bruk av =
(Ikke glem å dele alfaverdien
(signifikansnivået) på 2 når du bruker 2-haletester!!!!)
Husk å tolke svaret ditt og skriv utfyllende på
eksamensbesvarelsen
 Musikere
er kjent for sin ekstremt sunne
livsstil, og vi mistenker at denne gruppen har
et systolisk blodtrykk forskjellig fra 78.2.
 I løpet av "wacken open air" festivalen i
Tyskland får vi målt blodtrykket til 15
musikere dagen før konsert.
 Nullhypotese:
gjennomsnittlig blodtrykk =
78.2
 Vi bruker 5% signifikansnivå
De 15 prøvene har et gjennomsnitt på 82 og s=7
 t= 82-78.2 / (7/√15)= 2.102
 Frihetsgrader = 15 -1 = 14
 Finner den kritiske verdien 2,145 med df=14, 2hale-test med 5% signifikansnivå i t-tabellen
 Testobservatoren vår t er mindre en
forkastningsgrensen på 2.012. Den nøyaktige
verdien er p=0.054 dvs det er 5.4% sansylighet
for at våre eller mer ekstreme data har oppstått
ved en tilfeldighet
 Hva gjør du med H0?

 Vi
ønsker som regel å sammenligne to
gjennomsnitt der den sanne variansen er
ukjent.
 Vi må beregne testobservatoren ved hjelp av
gjennomsnitt, standardavvik (S) og antall
frihetsgrader
 Samme formel, men med modifikasjoner
NB! t med n-2 frihetsgrader
Forskjell i gjennomsnitt
Felles standardfeil
Denne er enkel
Denne krever litt mer
 Standardavviket
til to utvalg ved en t-test er
gitt ved
 Standardfeilen
er gitt ved
 Vi
ønsker å se på effekten av fysisk aktivitet
hos menn i alderen 20-30 år. Vi antar at det
maksimale oksygenopptaket er et godt mål
for kondisjon og vil sammenligne dette
mellom en gruppe innaktive og en gruppe
aktive menn.
 Gruppe 0 bedriver ikke idrett og betegnes
som innaktive
 Gruppe 1 trener minimum 3 ganger pr. uke og
betegnes som aktive
Gruppe 0
 42.6 44.8 48.0 47.5 47.1 50.1 45.8 45.1 44.4 43.7
 snitt:45.91
 standardavvik: 2.26
 Gruppe 1
 56.6 64.0 59.0 62.2 59.8 62.9 61.0 57.2 66.1 58.8
 Snitt: 60.76
 Standardavvik: 3.05

 Aktive
menn i alderen 20-30 år har bedre
kondisjon en inaktive menn i samme alder
 Nullhypotese: Det er ingen forskjell i
maksimalt oksygenopptak mellom de to
gruppene
 Ho : X1 - X0 = 0
 Vi vil være helt sikre og forkaster ikke
nullhypotesen før ved 1% signifikansnivå
 Vi
har valgt 1% forkastningsgrense og vi har
totalt 10 +10 = 20 personer med i studien (18
frihetsgrader)
 Vi regner ut testobservatoren ved hjelp av
Forskjell i gjennomsnitt
Felles standardfeil
 forskjell

i gjennomsnitt
60.76 – 45.91 = 14.79
 Felles
standardavvik
 S=
sqrt( 9*2.252 +9*3.052) / 18 = 2.68
 Felles standardfeil
 2.68*
sqrt(1/10 +1/10) = 1.20
 Testobservatoren
var:
Forskjell i gjennomsnitt
Felles standardfeil
 t=
14.79/1.20 = 12.33
 med d.f 18, hva er grensen vår for
forkastning på t-verdi (Husk vi bestemte oss
for 1%)
 Når
skal vi bruke z test?
 Når skal vi bruke t-test?
 Hvor mange frihetsgrader er det i en to-halet-test?