Spatiaalista mallinnusta pistedatalla Koettu terveys ja turvattomuus

Spatiaalista mallinnusta
pistedatalla
Koettu terveys ja turvattomuus
Helsingin metropolialueella
Teemu Kemppainen
Sosiaalitieteiden laitos, HY
Sosiaalilääketieteen päivät 3.11.2014
Visualisointi
• Miksi? Spatiaaliset trendit
– Tasoitus, naapuruston keskiarvo
• Miten? R, ggplot2: joustava
• Naapurusto
– Pistedata; lähimmät 10-400; ”liikkuva naapurusto”
– Naapuruston keskiarvo (=”viive”)
• Koettu terveys & turvattomuus
– Historialliset juuret: modernin epidemiologian ja
krimilogian syntyvaiheet
– Spatiaalisesti varsin erilaiset
Data
• Kyselydata (”Katumetro”, 2012, 36 %)
• Linkattu Ruututietokannasta kontekstitietoa
brutto-otoksen kaikille alkioille kotitalon
keskipisteen mukaan
Koettu terveys
• ”Kuinka hyvä terveydentilanne on nykyisin?”
• Erittäin hyvä – melko hyvä – keskitasoa –
melko huono – erittäin huono
Tietoturvasta: ei rantaviivoja ym, pisteessä ei vastaajan omaa arvoa, lisäksi täristys
Turvattomuus
• ”Kuinka turvalliseksi tunnettu olonne
kävellessänne omalla asuinalueellanne yksin
myöhään viikonloppuiltana?”
• Turvalliseksi – melko turvalliseksi – melko
turvattomaksi – turvattomaksi – en uskalla
käydä tuolloin ulkona – en liiku iltaisin ulkona.
Mallit,
AIC
tukee
myös
Mallinnusta varten mielessä…
• Jotain spatiaalista siellä on, etenkin
turvattomuudessa
• Mallivirheen kohinaoletus?
– Eli ei informaatiota, ei rakennetta residuaaleissa
Spatiaalinen (auto)korrelaatio
• Maantieteen ”ensimmäinen laki”
“[E]verything is related to everything else, but
near things are more related than distant
things.” (Tobler 1970, 236)
• Spatiaalinen autokorrelaatio
”[S]elf-correlation of values of a given attribute
arising from their relative locations in
geographic space” (Griffith 2003, 1)
- vrt. Sisäkorrelaatio, aikasarjat
Globaali Moranin I
• Mittaa spatiaalista autokorrelaatiota
– Välillä -1, 1
– 0: ei spatiaalista autokorrelaatiota
• Vasteet
– Koettu terveys
– Turvattomuus
0.019 (p ≤ 0.0001)
0.131 (p ≤ 0.0001)
• Täydet OLS mallien residuaalit
– Koettu terveys
0.004 (p = 0.05611)
à malli selittää
lähtökohtaisen pienen autokorrelaation, perusmallit OK!
– Turvattomuus
0.057 (p ≤ 0.0001) à OLS voi olla
ongelmallinen (tarkentuvuus, harhaisuus, teho)
OLS vs. Spatiaaliset mallit
• Kaksi tavallisinta: spatiaalinen viive- ja virhemalli
– Viive: vasteen spatiaalinen rakenne on huomioitu
vasteen viiveenä (eli naapuruston arvo) à tartunta,
diffuusio, itsensä kanssa vuorovaikutteinen prosessi
– Virhemalli: ...mallivirheen viiveenä à
mittaamattomat, spatiaalisesti jäsentyneet muuttujat
– R: spdep
• Nyt: OLS vs. spatiaaliset mallit
– Keskivirhe-estimaatit samaa luokkaa
– Joitakin huomattavia eroja piste-estimaateissa,
turvattomuuden mallissa
Piste-estimaatit
• Täyden mallin kontekstimuuttujat
– Ruudun SES (Ruututietokanta): low (ref.) – mid - hi
– Lähiöruutu: 0/1, (Mats Stjernberg 2013)
• Täysi OLS
– SES, hi:
– Lähiö:
.363 (p < .0005)
-.082 (p=.001)
(turvallisempi)
(turvattomampi)
• Täydet spatiaaliset mallit
– SES, hi:
– Lähiö:
.200 (viive) / .240 (virhe) (p < .0005)
-.043 (viive) / -.037 (virhe) (ns)
Mahdollinen ongelma
• Kaksitasoinen aineisto + spatiaalinen rakenne
• Spatiaaliset mallit & tyypillisesti yksitasoinen
aineisto
• Tässä juuri kontekstimuuttujat heilahtivat:
tulkinta?
• Monitasomalli mahdollisesti ongelmallinen:
– Yksin ruudussa
– Ruuturakenne on jatkuva ja korreloitunut (vrt.
ryväsotos, riippumattomat ryppäät)
• Uusi artikkeli ja uusi kokeilu
Kiitos!
Esitys perustuu Sosiaalilääketieteellisessä aikakauslehdessä
julkaistavaan artikkeliin:
Kemppainen, Teemu (2014): Spatiaalista mallinnusta pistedatalla:
kyselypohjainen analyysi koetusta terveydestä ja turvattomuudesta
Helsingin metropolialueella.
Tutkimus on osa Suomen Akatemian rahoittamaa PREFARE-projektia.
teemu.t.kemppainen(at)helsinki.fi