STAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS

STAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS
HARJOITUSTYÖ
Harjoitustyö tehdään yksin tai parin kanssa silloin, kun kurssin suoritetaan aktiivisella
osallistumisella viikkoharjoituksiin, luennoille ja harjoitustyöllä. Harjoitustyö tehdään yksin silloin,
kun kurssi suoritetaan tentillä ja harjoitustyöllä.
Ne opiskelijat, jotka suorittavat kurssin tenttimättä, palauttavat harjoitustyön viimeistään
perjantaina 13.3.2015. Ne opiskelijat, jotka suorittavat kurssin tentillä, palauttavat harjoitustyön
viikkoa ennen sitä tenttiä, johon osallistuvat. Harjoitustyöraportti palautetaan paperiversiona
luennoitsijan postilokeroon (Tervahovi-rakennus, D-siipi, 1. krs).
Harjoitustyö joko hyväksytään tai annetaan korjattavaksi. Tieto hyväksymisestä/korjausehdotuksista
lähetetään opiskelijalle sähköpostitse. Korjattu raportti palautetaan viimeistään kahden viikon
kuluttua siitä, kun raportti on annettu korjattavaksi.
Harjoitustyössä sovelletaan opintojaksolla esillä olleita tilastollisia menetelmiä. Harjoitustyössä
tehdään pieni empiirinen tutkimus ja raportoidaan kirjallisesti tutkimuksen tulokset. Harjoitustyön
tavoitteena on oppia tilastollisen menetelmän valintaa, tilastollisten menetelmien toteutusta SPSSohjelmalla ja saatujen tutkimustulosten raportointia. Tutkimustulokset on raportoitava
lukijaystävällisesti ja niin, että ko. opintojakson tasoiset tiedot tunteva lukija ymmärtää työn
sisällön. Raportin tulee olla n. 8-12 sivun mittainen (sisältäen kansilehden ja sisällysluettelon)
yhtenäinen kokonaisuus, joka sisältää tekstiin liitettyinä tarvittavat kuvat ja taulukot. Raporttiin EI
kuitenkaan tarvitse lisätä liitesivuja esimerkiksi kaikista tehdyistä analyyseistä. Raportin lisätyistä
kuvioista ja taulukoista ei myöskään tarvitse tehdä omia kuvio- ja taulukkoluetteloita. Raportin
kansilehdellä tulee olla työn nimi, tekijöiden nimet ja opiskelijanumerot sekä sähköpostiosoitteet.
Raportin rakenne voi olla esim. seuraavanlainen
1 Johdanto
Tässä kerrotaan lyhyesti aineistosta (mitkä ovat aineiston tilastoyksiköt, mitä muuttujia työssä
tarkastellaan) ja tutkimusongelmista, joita tarkastellaan (esim. käyvätkö nuoret vanhempia ihmisiä
useammin…, katsovatko naiset useammin … kuin miehet, ovatko Oulun läänissä asuvat
samanlaisia … kuin Länsi-Suomen läänissä asuvat).
2 Aineiston kuvaus
Tässä kuvaillaan valittujen muuttujien jakaumia hyödyntäen graafisia esityksiä, taulukoita ja
tunnuslukuja.
3 Riippuvuustarkastelut (otsikko aiheen mukaan)
Tässä analysoidaan muuttujien riippuvuuksia hyödyntäen graafisia esityksiä, taulukoita,
tunnuslukuja ja testituloksia.
3.1 Riippuvuustarkastelu 1 (otsikko aiheen mukaan)
3.2 Riippuvuustarkastelu 2 (otsikko aiheen mukaan)
(3.3 Riippuvuustarkastelu 3 (otsikko aiheen mukaan))
(3.4 Riippuvuustarkastelu 4 (otsikko aiheen mukaan))
4 Yhteenveto
Lopuksi esitetään yhteenveto tutkimustuloksista.
Harjoitustyön aineisto on ”Kulttuuri ja vapaa-aika Suomessa 2007”. SPSS-havaintoaineistoversio
ko. aineistosta on saatavilla kurssin kotisivulta (http://lipas.uwasa.fi/~chg/stat2100.html). Lyhyt
kuvaus tilastoyksiköistä ja muuttujista on saatavana erillisenä pdf-tiedostona myös kurssin
kotisivulta.
Harjoitustyö alkaa tutkimusongelmien pohtimisella, ja niihin sopivien muuttujien valinnalla. SPSSaineistossa muuttujat bv5 – k26a ovat taustamuuttujia ja muuttujat k30a – k77 kartoittavat vapaaajanviettoa ja kulttuurimieltymyksiä. SPSS-aineiston muuttujat eivät ole täydellisesti määritelty:
kaikkien muuttujien tilastolliseksi mitta-asteikoksi on merkitty Nominal, joten ko. tieto joudutaan
tarpeen tullen korjaamaan sopivaksi!
Jos harjoitustyö tehdään yksin, valitaan taustamuuttujista (bv5 – k26a) ainakin 2 mitta-asteikoltaan
erilaista muuttujaa ja ainakin 1 muuttuja vapaa-ajanviettoa ja kulttuurimieltymyksiä kartoittavista
muuttujista k30a – k77 (mitta-asteikolla ei ole väliä). Työssä on oltava siis ainakin kaksi
riippuvuustarkastelua erilaisine tutkimusongelmineen siten, että kussakin analyysissä on
yksittäisenä selitettävänä muuttujana jokin muuttujista k30a – k77 ja selittävänä muuttujana jokin
taustamuuttuja .
Jos harjoitustyö tehdään parin kanssa, valitaan taustamuuttujista (bv5 – k26a) ainakin 2 mittaasteikoltaan erilaista muuttujaa ja ainakin 2 mitta-asteikoltaan erilaista muuttujaa muuttujista k30a
– k77. Työssä on oltava ainakin neljä riippuvuustarkastelua erilaisine tutkimusongelmineen siten,
että kussakin analyysissä on yksittäisenä selitettävänä muuttujana jokin muuttujista k30a – k77 ja
selittävänä muuttujana jokin taustamuuttuja.
Aineiston analysointi alkaa esittelemällä valittujen muuttujien jakaumat käyttäen frekvenssijakaumataulukoita, tilastollisia tunnuslukuja ja/tai sopivia graafisia esityksiä. Kuvailutapa valitaan
sopivaksi muuttujan mitta-asteikon perusteella. Raporttiin voi lisätä SPSS:stä kuvioita ja taulukoita
(muokattuna tarpeen mukaan) tekstin joukkoon, kunhan tekstissä on niihin viitattu.
Muuttujien jakaumien esittelyn jälkeen selvitellään riippuvuussuhteita opintojaksolla opituin
menetelmin. Tutkimusongelmat opiskelijat siis asettavat itse ja valitsevat analysointimenetelmät
muuttujien tilastollisten mitta-asteikkojen ja jakaumamuotojen perusteella. Jokaisessa
riippuvuustarkastelussa käytetään vain yhtä, tilanteeseen parhaiten sopivaa menetelmää. Kaikkiin
näistä riippuvuusanalyyseistä on liitettävä tilastollinen päättely. Kuvaileva tilastotiede ei siis riitä,
vaan tilastollisia testejä käytetään tilastolliseen päättelyyn. Menetelmävihjeitä saat seuraavan sivun
taulukosta.
Lopuksi tulokset kootaan yhteenvedoksi.
Nro
1
2
3
4
Mitta-asteikko
X
(selittävä
NOMINAALI
/ORDINAALI
NOM
(kaksiarvoinen)
NOM
(useita arvoja)
NOM
(kaksiarvoinen)
Y
selitettävä)
NOM
ORD
ORD
INT/
SUHDE
Muutamia
vaihtoehtoisia
riippuvuustutkimusmenetelmiä, -tunnuslukuja ja/tai –testejä.








5
NOM
(useampi kuin
2 arvoa)
INT/
SUHDE




6
7
8
9
ORD
ORD



ORD
INT/
SUHDE
INTERVALLI/
SUHDE
NOM


ORD


INT/ SUHDE

10
INT/ SUHDE
INT/
SUHDE



Ristiintaulukointi, kontigenssikerroin, Cramerin V ja
ristiintaulukosta 2-riippumattomuustesti
Mann-Whitneyn U–testi
Sama menetelmä kuin kohdassa 1
Kruskal-Wallis –testi
Sama menetelmä kuin kohdassa 1
Y normaalijakautunut kummassakin ryhmässä:
kahden otoksen keskiarvotesti
Y ei normaalijakautunut: Mann-Whitneyn U-testi
(Jos Y normaalijakautunut, myös lineaarinen regressio
testeineen niin, että selittäjä on dummy-muuttuja.)
Y normaalijakautunut ryhmissä ja populaatiovarianssit
ovat
yhtä
suuret:
yksisuuntainen
varianssianalyysi ja siitä F-testi
Y normaalijakautunut ryhmissä ja populaatiovarianssit eivät yhtä suuret: esim. Welchin testi
Y ei normaalijakautunut: Kruskal-Wallis –testi
(Jos Y normaalijakautunut, myös lineaarinen regressio
testeineen niin, että selittäjät ovat dummy-muuttujia.)
Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja
korrelaatiotesti
Sama menetelmä kuin kohdassa 1
Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja
korrelaatiotesti
Samat menetelmät kuin kohdassa 5
Luokittele X:n arvot luokkiin ja sama menetelmä kuin
kohdassa 1
(Logistinen regressio testeineen; ei tällä kurssilla)
Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja
korrelaatiotesti
Luokittele X:n arvot luokkiin ja samat menetelmät
kuin kohdassa 3
X:n
ja
Y:n
yhteisjakaumana
2-uloitteinen
normaalijakauma:
Pearsonin
korrelaatio
ja
korrelaatiotesti
X:n
ja
Y:n
yhteisjakaumana
2-uloitteinen
normaalijakauma: lineaarinen regressio ja siihen
liittyvät testit
Jos
ei
normaalijakauma:
Spearmanin
järjestyskorrelaatio
tai
Kendallin
tau-b
ja
korrelaatiotesti