Test for uafhængighed af inddelingskriterier (homogenitetstest)

GeoGebra og CHI i anden
Eksemplerne er taget fra: http://uvmat.dk/stat_aau/chi2JULI09.pdf
Test for uafhængighed af inddelingskriterier (homogenitetstest)
Under værktøjer vælges Sandsynlighedslommeregner
Som fordeling vælges Chi i anden
Vælg herefter fanen statistik og Chi_i_anden
GeoGebra og CHI i anden
Antal rækker og søjler tastes ind.
De observerede værdier tastes ind, og med et flueben i forventet antal, udregnes de forventede værdier
Nederst i tabellen udregnes
df
Antal frihedsgrader
χ2
Teststørrelsen
p
p-værdien, altså sandsynligheden for χ2-værdien eller derover
GeoGebra og CHI i anden
Vi vender nu tilbage til fanen fordeling
Chi i anden er valgt
df sættes i dette tilfælde til 1
Højresidet analyse vælges
Herefter har jeg to muligheder
1. Jeg kan vælge mit signifikansniveau. I dette tilfælde er det sat til 5%. I højre felt skriver jeg 0.05, og
jeg får i venstre felt beregnet P(X≥3.8415) = 0.05. Dvs. min kritiske værdi er 3.8415.
GeoGebra og CHI i anden
2. Jeg kan vælge at indtaste P(4.7735≤X), altså finde sandsynligheden for, at den stokastiske variable
er større end eller lig teststørrelsen. Denne sandsynlighed kaldes vores p-værdi. I dette tilfælde er
p-værdien 0.0289.
I denne opgave kommer jeg frem til, at min teststørrelse er på 4.7735. Den er altså større end min kritiske
værdi, som var på 3.8415, og jeg må forkaste min hypotese på et 5% signifikansniveau.
Min p-værdi er på 0,0289, hvilket betyder, at jeg i 2.89% af de tilfælde, hvor jeg foretager en undersøgelse,
vil få en teststørrelse, der er 4.7735 eller derovre, selv om der ikke er forskel på drengenes og pigernes
tøjvaner.
GeoGebra og CHI i anden
Test for repræsentativitet i forhold til underliggende
fordeling (Goodness Of Fit)
Under Vis vælges Regneark
Indtast den procentvise fordeling.
Brug regnearket til at beregne de forventede værdier ud fra den procentvise fordeling og det observerede
antal.
Under værktøjer vælges Sandsynlighedslommeregneren, fanen Statistik og Goodness of Fit Test.
Antal rækker tastes ind.
Tast observerede og forventede værdier ind.
df
Er beregnet til 7
χ2
Teststørrelsen er beregnet til 33.8848
p
p-værdien er beregnet til 0
GeoGebra og CHI i anden
Vi vender nu tilbage til fanen fordeling
Chi i anden er valgt
df sættes i dette tilfælde til 7
Højresidet analyse vælges
Som i første eksempel har jeg to muligheder
1. Jeg kan vælge et signifikansniveau. I dette tilfælde er det sat til 5%. I højre felt skriver jeg 0.05, og
jeg får i venstre felt beregnet P(X≥14.0671) = 0.05. Dvs. min kritiske værdi er 14.0671.
GeoGebra og CHI i anden
2. I denne opgave kommer jeg frem til, at min teststørrelse er på 33.8848. Den er altså større end min
kritiske værdi, som var 14.0671, og jeg må forkaste min hypotese på et 5% signifikansniveau. Jeg
kan lige som i det foregående eksempel finde p-værdien ved at indtaste P(33.8848≤X).
Min p-værdi er 0, hvilket betyder, at sandsynligheden for at få en teststørrelse på 33.8488 eller
derover er så lille, at jeg uanset valg af signifikansniveau altid vil forkaste min hypotese.
Indkomstfordelingen afviger altså signifikant fra den forventede indkomstfordeling.