STAT2100 TILASTOLLINEN TIETOJENKÄSITTELY SPSS HARJOITUSTYÖ Harjoitustyö tehdään yksin tai parin kanssa silloin, kun kurssin suoritetaan aktiivisella osallistumisella viikkoharjoituksiin, luennoille ja harjoitustyöllä. Harjoitustyö tehdään yksin silloin, kun kurssi suoritetaan tentillä ja harjoitustyöllä. Ne opiskelijat, jotka suorittavat kurssin tenttimättä, palauttavat harjoitustyön viimeistään perjantaina 13.3.2015. Ne opiskelijat, jotka suorittavat kurssin tentillä, palauttavat harjoitustyön viikkoa ennen sitä tenttiä, johon osallistuvat. Harjoitustyöraportti palautetaan paperiversiona luennoitsijan postilokeroon (Tervahovi-rakennus, D-siipi, 1. krs). Harjoitustyö joko hyväksytään tai annetaan korjattavaksi. Tieto hyväksymisestä/korjausehdotuksista lähetetään opiskelijalle sähköpostitse. Korjattu raportti palautetaan viimeistään kahden viikon kuluttua siitä, kun raportti on annettu korjattavaksi. Harjoitustyössä sovelletaan opintojaksolla esillä olleita tilastollisia menetelmiä. Harjoitustyössä tehdään pieni empiirinen tutkimus ja raportoidaan kirjallisesti tutkimuksen tulokset. Harjoitustyön tavoitteena on oppia tilastollisen menetelmän valintaa, tilastollisten menetelmien toteutusta SPSSohjelmalla ja saatujen tutkimustulosten raportointia. Tutkimustulokset on raportoitava lukijaystävällisesti ja niin, että ko. opintojakson tasoiset tiedot tunteva lukija ymmärtää työn sisällön. Raportin tulee olla n. 8-12 sivun mittainen (sisältäen kansilehden ja sisällysluettelon) yhtenäinen kokonaisuus, joka sisältää tekstiin liitettyinä tarvittavat kuvat ja taulukot. Raporttiin EI kuitenkaan tarvitse lisätä liitesivuja esimerkiksi kaikista tehdyistä analyyseistä. Raportin lisätyistä kuvioista ja taulukoista ei myöskään tarvitse tehdä omia kuvio- ja taulukkoluetteloita. Raportin kansilehdellä tulee olla työn nimi, tekijöiden nimet ja opiskelijanumerot sekä sähköpostiosoitteet. Raportin rakenne voi olla esim. seuraavanlainen 1 Johdanto Tässä kerrotaan lyhyesti aineistosta (mitkä ovat aineiston tilastoyksiköt, mitä muuttujia työssä tarkastellaan) ja tutkimusongelmista, joita tarkastellaan (esim. käyvätkö nuoret vanhempia ihmisiä useammin…, katsovatko naiset useammin … kuin miehet, ovatko Oulun läänissä asuvat samanlaisia … kuin Länsi-Suomen läänissä asuvat). 2 Aineiston kuvaus Tässä kuvaillaan valittujen muuttujien jakaumia hyödyntäen graafisia esityksiä, taulukoita ja tunnuslukuja. 3 Riippuvuustarkastelut (otsikko aiheen mukaan) Tässä analysoidaan muuttujien riippuvuuksia hyödyntäen graafisia esityksiä, taulukoita, tunnuslukuja ja testituloksia. 3.1 Riippuvuustarkastelu 1 (otsikko aiheen mukaan) 3.2 Riippuvuustarkastelu 2 (otsikko aiheen mukaan) (3.3 Riippuvuustarkastelu 3 (otsikko aiheen mukaan)) (3.4 Riippuvuustarkastelu 4 (otsikko aiheen mukaan)) 4 Yhteenveto Lopuksi esitetään yhteenveto tutkimustuloksista. Harjoitustyön aineisto on ”Kulttuuri ja vapaa-aika Suomessa 2007”. SPSS-havaintoaineistoversio ko. aineistosta on saatavilla kurssin kotisivulta (http://lipas.uwasa.fi/~chg/stat2100.html). Lyhyt kuvaus tilastoyksiköistä ja muuttujista on saatavana erillisenä pdf-tiedostona myös kurssin kotisivulta. Harjoitustyö alkaa tutkimusongelmien pohtimisella, ja niihin sopivien muuttujien valinnalla. SPSSaineistossa muuttujat bv5 – k26a ovat taustamuuttujia ja muuttujat k30a – k77 kartoittavat vapaaajanviettoa ja kulttuurimieltymyksiä. SPSS-aineiston muuttujat eivät ole täydellisesti määritelty: kaikkien muuttujien tilastolliseksi mitta-asteikoksi on merkitty Nominal, joten ko. tieto joudutaan tarpeen tullen korjaamaan sopivaksi! Jos harjoitustyö tehdään yksin, valitaan taustamuuttujista (bv5 – k26a) ainakin 2 mitta-asteikoltaan erilaista muuttujaa ja ainakin 1 muuttuja vapaa-ajanviettoa ja kulttuurimieltymyksiä kartoittavista muuttujista k30a – k77 (mitta-asteikolla ei ole väliä). Työssä on oltava siis ainakin kaksi riippuvuustarkastelua erilaisine tutkimusongelmineen siten, että kussakin analyysissä on yksittäisenä selitettävänä muuttujana jokin muuttujista k30a – k77 ja selittävänä muuttujana jokin taustamuuttuja . Jos harjoitustyö tehdään parin kanssa, valitaan taustamuuttujista (bv5 – k26a) ainakin 2 mittaasteikoltaan erilaista muuttujaa ja ainakin 2 mitta-asteikoltaan erilaista muuttujaa muuttujista k30a – k77. Työssä on oltava ainakin neljä riippuvuustarkastelua erilaisine tutkimusongelmineen siten, että kussakin analyysissä on yksittäisenä selitettävänä muuttujana jokin muuttujista k30a – k77 ja selittävänä muuttujana jokin taustamuuttuja. Aineiston analysointi alkaa esittelemällä valittujen muuttujien jakaumat käyttäen frekvenssijakaumataulukoita, tilastollisia tunnuslukuja ja/tai sopivia graafisia esityksiä. Kuvailutapa valitaan sopivaksi muuttujan mitta-asteikon perusteella. Raporttiin voi lisätä SPSS:stä kuvioita ja taulukoita (muokattuna tarpeen mukaan) tekstin joukkoon, kunhan tekstissä on niihin viitattu. Muuttujien jakaumien esittelyn jälkeen selvitellään riippuvuussuhteita opintojaksolla opituin menetelmin. Tutkimusongelmat opiskelijat siis asettavat itse ja valitsevat analysointimenetelmät muuttujien tilastollisten mitta-asteikkojen ja jakaumamuotojen perusteella. Jokaisessa riippuvuustarkastelussa käytetään vain yhtä, tilanteeseen parhaiten sopivaa menetelmää. Kaikkiin näistä riippuvuusanalyyseistä on liitettävä tilastollinen päättely. Kuvaileva tilastotiede ei siis riitä, vaan tilastollisia testejä käytetään tilastolliseen päättelyyn. Menetelmävihjeitä saat seuraavan sivun taulukosta. Lopuksi tulokset kootaan yhteenvedoksi. Nro 1 2 3 4 Mitta-asteikko X (selittävä NOMINAALI /ORDINAALI NOM (kaksiarvoinen) NOM (useita arvoja) NOM (kaksiarvoinen) Y selitettävä) NOM ORD ORD INT/ SUHDE Muutamia vaihtoehtoisia riippuvuustutkimusmenetelmiä, -tunnuslukuja ja/tai –testejä. 5 NOM (useampi kuin 2 arvoa) INT/ SUHDE 6 7 8 9 ORD ORD ORD INT/ SUHDE INTERVALLI/ SUHDE NOM ORD INT/ SUHDE 10 INT/ SUHDE INT/ SUHDE Ristiintaulukointi, kontigenssikerroin, Cramerin V ja ristiintaulukosta 2-riippumattomuustesti Mann-Whitneyn U–testi Sama menetelmä kuin kohdassa 1 Kruskal-Wallis –testi Sama menetelmä kuin kohdassa 1 Y normaalijakautunut kummassakin ryhmässä: kahden otoksen keskiarvotesti Y ei normaalijakautunut: Mann-Whitneyn U-testi (Jos Y normaalijakautunut, myös lineaarinen regressio testeineen niin, että selittäjä on dummy-muuttuja.) Y normaalijakautunut ryhmissä ja populaatiovarianssit ovat yhtä suuret: yksisuuntainen varianssianalyysi ja siitä F-testi Y normaalijakautunut ryhmissä ja populaatiovarianssit eivät yhtä suuret: esim. Welchin testi Y ei normaalijakautunut: Kruskal-Wallis –testi (Jos Y normaalijakautunut, myös lineaarinen regressio testeineen niin, että selittäjät ovat dummy-muuttujia.) Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti Sama menetelmä kuin kohdassa 1 Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti Samat menetelmät kuin kohdassa 5 Luokittele X:n arvot luokkiin ja sama menetelmä kuin kohdassa 1 (Logistinen regressio testeineen; ei tällä kurssilla) Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti Luokittele X:n arvot luokkiin ja samat menetelmät kuin kohdassa 3 X:n ja Y:n yhteisjakaumana 2-uloitteinen normaalijakauma: Pearsonin korrelaatio ja korrelaatiotesti X:n ja Y:n yhteisjakaumana 2-uloitteinen normaalijakauma: lineaarinen regressio ja siihen liittyvät testit Jos ei normaalijakauma: Spearmanin järjestyskorrelaatio tai Kendallin tau-b ja korrelaatiotesti
© Copyright 2024