aySTAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS

aySTAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS
HARJOITUSTYÖ
Harjoitustyössä tehdään pieni empiirinen tutkimus ja raportoidaan kirjallisesti tutkimuksen tulokset.
Harjoitustyön tavoitteena on oppia tilastollisen menetelmän valintaa, tilastollisten menetelmien
toteutusta SPSS-ohjelmalla ja saatujen tutkimustulosten raportointia.
Harjoitustyön aineisto on ”Kulttuuri ja vapaa-aika Suomessa 2007”. SPSS-havaintoaineistoversio
ko. aineistosta on saatavilla kurssin kotisivulta (http://lipas.uwasa.fi/~chg/aySTAT2100sj.html).
SPSS-aineiston muuttujat eivät ole täydellisesti määritelty: kaikkien muuttujien tilastolliseksi mittaasteikoksi on merkitty Nominal, joten ko. tieto joudutaan tarpeen tullen korjaamaan sopivaksi!
Lyhyt kuvaus tilastoyksiköistä ja muuttujista on saatavana erillisenä pdf-tiedostona kurssin
kotisivulta.
Harjoitustyö alkaa tutkimusongelmien pohtimisella, ja niihin sopivien muuttujien valinnalla. Jos
harjoitustyö tehdään yksin, tutkitaan yksi ongelma. Jos harjoitustyö tehdään parin kanssa, tutkitaan
2 ongelmaa. SPSS-aineistossa muuttujat bv5 – k26a ovat taustamuuttujia ja muuttujat k30a – k77
kartoittavat vapaa-ajanviettoa ja kulttuurimieltymyksiä. Tutkimusongelman on liityttävä
riippuvuustutkimukseen siten, että kussakin riippuvuustutkimuksessa on yksittäisenä selitettävänä
muuttujana jokin muuttujista k30 – k77, ja selittävänä muuttujana jokin taustamuuttuja.
Tutkimusongelmat voivat olla mm. seuraavanlaisia: onko syntymävuodella ja kirjojen määrällä
yhteyttä (selittäjä: syntymävuosi, selitettävä: kirjojen määrä), katsovatko naiset useammin
Euroviisuja kuin miehet (selittäjä: sukupuoli, selitettävä: Euroviisujen katselu), kokevatko Oulun
läänissä asuvat terveydentilansa samanlaiseksi kuin Länsi-Suomen läänissä asuvat (selittäjä:
asuinlääni, selitettävä: terveydentila), jne
Aineiston analysointi alkaa esittelemällä tutkimusongelmiin valittujen muuttujien jakaumat käyttäen
frekvenssijakaumataulukoita, tilastollisia tunnuslukuja ja/tai kuvioita. Kuvailutapa valitaan
sopivaksi muuttujan mitta-asteikon perusteella. Raporttiin voi lisätä SPSS:stä kuvioita ja taulukoita
(muokattuna tarpeen mukaan) tekstin joukkoon, kunhan tekstissä niihin viitataan
Muuttujien jakaumien esittelyn jälkeen selvitellään riippuvuussuhteita opintojaksolla opituin
menetelmin. Riippuvuustutkimusmenetelmä valitaan muuttujien tilastollisten mitta-asteikkojen ja
jakaumamuotojen perusteella. Jokaisessa riippuvuustarkastelussa käytetään vain yhtä, tilanteeseen
parhaiten sopivaa menetelmää. Kaikkiin näistä riippuvuusanalyyseistä on liitettävä tilastollinen
päättely. Kuvaileva tilastotiede ei siis riitä, vaan tilastollisia testejä käytetään tilastolliseen
päättelyyn. Menetelmävihjeitä löytyy myöhemmin esitettävästä taulukosta.
Tulosraportin rakenne voi olla esim. seuraavanlainen
1 Johdanto
Tässä kerrotaan lyhyesti aineistosta (mitkä ovat aineiston tilastoyksiköt, mitä muuttujia työssä
tarkastellaan) ja tutkimusongelmista, joita tarkastellaan.
2 Aineiston kuvaus
Tässä kuvaillaan valittujen muuttujien jakaumia hyödyntäen graafisia esityksiä, taulukoita ja/tai
tunnuslukuja.
3 Riippuvuustarkastelu tai riippuvuustarkastelut (otsikko aiheen mukaan)
Nro
1
2
3
4
Mitta-asteikko
X
(selittävä
NOMINAALI
/ORDINAALI
NOM
(kaksiarvoinen)
NOM
(useita arvoja)
NOM
(kaksiarvoinen)
Y
selitettävä)
NOM
ORD
ORD
INT/
SUHDE
5
NOM
(useampi kuin
2 arvoa)
INT/
SUHDE
6
ORD
ORD
7
ORD
INT/
SUHDE
8
INTERVALLI/
SUHDE
NOM
9
INT/ SUHDE
ORD
Riippuvuustutkimusmenetelmä, -tunnuslukuja ja/tai testejä (tilastollista päättelyä varten).
(Jos useita, on ensisijainen menetelmä ensimmäisenä.)
 Ristiintaulukointi, kontigenssikerroin, Cramerin V ja
ristiintaulukosta 2-riippumattomuustesti
 Mann-Whitneyn U–testi
 Sama menetelmä kuin kohdassa 1
 Kruskal-Wallis –testi
 Sama menetelmä kuin kohdassa 1
 Y normaalijakautunut kummassakin ryhmässä:
kahden otoksen keskiarvotesti
 Y ei normaalijakautunut: Mann-Whitneyn U-testi
 (Jos Y normaalijakautunut, myös lineaarinen regressio
testeineen niin, että selittäjä on dummy-muuttuja.)
 Y normaalijakautunut ryhmissä ja populaatiovarianssit
ovat
yhtä
suuret:
yksisuuntainen
varianssianalyysi ja siitä F-testi
 Y normaalijakautunut ryhmissä ja populaatiovarianssit eivät yhtä suuret: esim. Welchin testi
 Y ei normaalijakautunut: Kruskal-Wallis –testi
 (Jos Y normaalijakautunut, myös lineaarinen regressio
testeineen niin, että selittäjät ovat dummy-muuttujia.)
 Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja
korrelaatiotesti
 Sama menetelmä kuin kohdassa 1
 Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja
korrelaatiotesti
 Samat menetelmät kuin kohdassa 5
 (Logistinen regressio testeineen; ei tällä kurssilla)
 Luokittele X:n arvot luokkiin ja sama menetelmä kuin
kohdassa 1


10
INT/ SUHDE
INT/
SUHDE



Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja
korrelaatiotesti
Luokittele X:n arvot luokkiin ja samat menetelmät
kuin kohdassa 3
X:n
ja
Y:n
yhteisjakaumana
2-uloitteinen
normaalijakauma:
Pearsonin
korrelaatio
ja
korrelaatiotesti
X:n
ja
Y:n
yhteisjakaumana
2-uloitteinen
normaalijakauma: lineaarinen regressio ja siihen
liittyvät testit
Jos
ei
normaalijakauma:
Spearmanin
järjestyskorrelaatio
tai
Kendallin
tau-b
ja
korrelaatiotesti