4 Aineiston kuvaaminen numeerisesti 1 4.1 Frekvenssijakauman

4 Aineiston kuvaaminen numeerisesti
1
4.1 Frekvenssijakauman muodostaminen tietokoneohjelmilla
Tarkastellaan lasten syntymäpainon frekvenssijakauman (kuva 1, oikea sarake) muodostamista Excel- ja SPSS-ohjelmalla. Lasten syntymäpainot ovat Excel-tiedostossa Synnytys.xsl
olevan havaintomatriisin sarakkeessa x10.
Kuva 1. Lapsen syntymäpainon frekvenssijakauma
4.1.1. Frekvenssijakauman muodostaminen Excel-ohjelmalla
1. Avataan tiedosto http://users.metropolia.fi/~pasitr/opas/Ran13/04/01/Synnytys.xlsx.
2. Merkitään luokkien ylärajat sarakkeeseen O (kuva 2, solut O1:07).
3. Avataan valikko File (Tiedosto), josta valitaan Options.
4. Valitaan Add-ins (Apuohjelmat)
5. Valitaan ruudusta Manage (Hallinta) vaihtoehto Excel Add-ins (Excel-apuohjelmat)
6. Näpäytetään Go (Siirry).
7. Rastitetaan kohta Analyysityökalut ja näpäytetään OK.
8. Avataan valikko Data (Tiedot)
9. Valitaan Data-analysis (Tietojen analysointi).
10. Valitaan Histogram (Histogrammi) ja näpäytetään OK.
11. Tehdään samat asetukset kuin kuvassa 2
12. Näpäytetään OK, jolloin tulokset ilmestyvät Excel-työkirjan uudelle välilehdelle (kuva 3 a).
Kuva 2. Valinnat lapsen syntymäpainon frekvenssijakaumaa muodostettaessa
2
Tilastomatematiikka
a) muokkaamaton
b) muokattu
Kuva 3. Lapsen syntymäpainon frekvenssijakauma Excel-ohjelmalla muodostettuna
4.1.1. Frekvenssijakauman muodostaminen SPSS-ohjelmalla
1.
2.
3.
4.
Avataan SPSS-ohjelma
Valitaan File-valikon Open-alivalikon toiminto Data (kuva 4).
Valitaan Excel-tiedosto Synnytys.xls ikkunaan Open data (kuva 5).
Hyväksytään seuraava vaihe (kuva 6) näpäyttämällä OK.
Kuva 4. Valitaan File-Open-Data
Kuva 5. Excel-tiedoston Synnytys.xls valinta ikkunaan Open data
4 Aineiston kuvaaminen numeerisesti
3
5. Kavennetaan sarakevälejä (kuva 7)
6. Aloitetaan tiedoston talletus näpäyttämällä painiketta Save this document (kuva 8)
7. Annetaan tiedostolle nimi Synnytys (kuva 9) ja näpäytetään Save .
Kuva 6. Ensimmäinen rivi sisältää muuttujien nimet
Kuva 7. Kavennetaan sarakevälejä
Kuva 8. Tiedoston talletus aloitetaan painikkeesta Save this document
Kuva 9. Annetaan tiedostolle nimi Synnytys ja talletetaan se samaan paikkaan kuin Excel-tiedosto
4
Tilastomatematiikka
8. Valitaan Transform - Recode into Different Variables (kuva 10).
9. Valitaan muuttuja x10 ruutuun Numeric Variable -> Output Variable (kuva 11, kohta 1)
10. Kirjoitetaan ruutuun Name uuden muuttujan nimi paika (kuva 11, kohta 2)
11. Kirjoitetaan ruutuun Label uuden muuttujan selite paino luokiteltuna (kuva 11, kohta 3)
12. Näpäytetään painiketta Change (kuva 11, kohta 4)
13. Näpäytetään painiketta Old and new Values ... (kuva 11, kohta 5)
14. Valitaan ruutuun Range, LOWEST through value: arvo 2000 ja annetaan ruutuun New
Value arvo 1 (kuva 12)
Kuva 10. Valitaan Transform - Recode into Different Variables
Kuva 11. Muuttuja x10 on valittu ruutuun Numeric Variable -> Output Variable
Kuva 12. Ensimmäisen luokan yläraja ja uusi arvo
4 Aineiston kuvaaminen numeerisesti
5
15. Annetaan kohdassa Range toisen luokan rajat (kuva 13, kohta 1)
16. Annetaan ruutuun New Value toisen luokan arvoksi 2 (kuva 13, kohta 2)
17. Näpäytetään Add (kuva 13, kohta 3)
18. Tehdään luokkien 2501-3000, 3001-3500, 3501-4000, 4001-4500 ja 4501-5000 määritys
(kuva 14) samalla periaatteella kuin luokan 2001-2500 määritys asettamalla rajat ja uusi
arvo (kohta 12, 13 ja 14).
Kuva 13. Toisen luokan alarajaksi 2001, ylärajaksi 2500 ja uudeksi arvoksi 2
Kuva 14. Luokkien 2501-3000, 3001-3500, 3501-4000, 4001-4500 ja 4501-5000 määritys
6
Tilastomatematiikka
19. Valitaan ruutuun Range value through HIGHEST: arvo 5001 (kuva 15, kohta 1)
20. Annetaan ruutuun New Value arvo 8 (kuva 15, kohta 2)
21. Näpäytetään Add (kuva 15, kohta 3)
22. Näpäytetään Continue
23. Näpäytetään OK, jolloin muuttujalistassa on uusi muuttuja pailka (kuva 16)
24. Otetaan esille Variable View -näkymä (kuva 17, kohta 1) ja näpäytetään saraketta Value
(kuva 17, kohta 2), jonka jälkeen voidaan muuttujien arvojen selitteet (kuva 18)
Kuva 15. Viimeisen luokan alaraja 5001 ja uusi arvo 8
Kuva 16. Uusi muuttuja pailka on muuttujalistassa
Kuva 17. Variable View -näkymässä määritetään muuttujien arvojen selitteet kohdassa Value
4 Aineiston kuvaaminen numeerisesti
25. Asetetaan ensimmäisen luokan arvon 1 selitteeksi -2000 (kuva 18).
26. Näpäytetään painiketta Add (kuva 18)
27. Asetetaan arvon 2 selitteeksi 2001-2500 (kuva 19).
28. Asetetaan arvon 3 selitteeksi 2501-3000 (kuva 19).
29. Asetetaan arvon 4 selitteeksi 3001-3500 (kuva 19).
30. Asetetaan arvon 5 selitteeksi 3501-4000 (kuva 19).
31. Asetetaan arvon 6 selitteeksi 4001-4500 (kuva 19).
32. Asetetaan arvon 7 selitteeksi 4501-5000 (kuva 19).
33. Asetetaan arvon 8 selitteeksi 5001- (kuva 20).
Kuva 18. Ensimmäisen luokan arvon 1 selitteeksi asetetaan -2000
Kuva 19. Luokkien 2, 3, 4, 5, 6, ja 7 selitteet
Kuva 20. Luokan 8 selite on asetettu
7
8
Tilastomatematiikka
34. Valitaan Analyze - Descriptive Statistics - Frequencies (kuva 21).
35. Valitaan muuttuja paino luokiteltuna ruutuun Variable(s):
36. Näpäytetään OK, jolloin näytölle ilmestyy lasten syntymäpainon frekvenssijakauma
(kuva 23)
Kuva 21. Valitaan Analyze - Descriptive Statistics - Frequencies
Kuva 22. Muuttuja paino luokiteltuna on valittu ruutuun Variable(s):
Kuva 23. Lasten lasten syntymäpainon frekvenssijakauma1
1
Samanlainen esimerkki on kirjassa Heikkilä Tarja, Tilastollinen tutkimus, 2004, sivulla 134-135