Spatiaalista mallinnusta pistedatalla Koettu terveys ja turvattomuus Helsingin metropolialueella Teemu Kemppainen Sosiaalitieteiden laitos, HY Sosiaalilääketieteen päivät 3.11.2014 Visualisointi • Miksi? Spatiaaliset trendit – Tasoitus, naapuruston keskiarvo • Miten? R, ggplot2: joustava • Naapurusto – Pistedata; lähimmät 10-400; ”liikkuva naapurusto” – Naapuruston keskiarvo (=”viive”) • Koettu terveys & turvattomuus – Historialliset juuret: modernin epidemiologian ja krimilogian syntyvaiheet – Spatiaalisesti varsin erilaiset Data • Kyselydata (”Katumetro”, 2012, 36 %) • Linkattu Ruututietokannasta kontekstitietoa brutto-otoksen kaikille alkioille kotitalon keskipisteen mukaan Koettu terveys • ”Kuinka hyvä terveydentilanne on nykyisin?” • Erittäin hyvä – melko hyvä – keskitasoa – melko huono – erittäin huono Tietoturvasta: ei rantaviivoja ym, pisteessä ei vastaajan omaa arvoa, lisäksi täristys Turvattomuus • ”Kuinka turvalliseksi tunnettu olonne kävellessänne omalla asuinalueellanne yksin myöhään viikonloppuiltana?” • Turvalliseksi – melko turvalliseksi – melko turvattomaksi – turvattomaksi – en uskalla käydä tuolloin ulkona – en liiku iltaisin ulkona. Mallit, AIC tukee myös Mallinnusta varten mielessä… • Jotain spatiaalista siellä on, etenkin turvattomuudessa • Mallivirheen kohinaoletus? – Eli ei informaatiota, ei rakennetta residuaaleissa Spatiaalinen (auto)korrelaatio • Maantieteen ”ensimmäinen laki” “[E]verything is related to everything else, but near things are more related than distant things.” (Tobler 1970, 236) • Spatiaalinen autokorrelaatio ”[S]elf-correlation of values of a given attribute arising from their relative locations in geographic space” (Griffith 2003, 1) - vrt. Sisäkorrelaatio, aikasarjat Globaali Moranin I • Mittaa spatiaalista autokorrelaatiota – Välillä -1, 1 – 0: ei spatiaalista autokorrelaatiota • Vasteet – Koettu terveys – Turvattomuus 0.019 (p ≤ 0.0001) 0.131 (p ≤ 0.0001) • Täydet OLS mallien residuaalit – Koettu terveys 0.004 (p = 0.05611) à malli selittää lähtökohtaisen pienen autokorrelaation, perusmallit OK! – Turvattomuus 0.057 (p ≤ 0.0001) à OLS voi olla ongelmallinen (tarkentuvuus, harhaisuus, teho) OLS vs. Spatiaaliset mallit • Kaksi tavallisinta: spatiaalinen viive- ja virhemalli – Viive: vasteen spatiaalinen rakenne on huomioitu vasteen viiveenä (eli naapuruston arvo) à tartunta, diffuusio, itsensä kanssa vuorovaikutteinen prosessi – Virhemalli: ...mallivirheen viiveenä à mittaamattomat, spatiaalisesti jäsentyneet muuttujat – R: spdep • Nyt: OLS vs. spatiaaliset mallit – Keskivirhe-estimaatit samaa luokkaa – Joitakin huomattavia eroja piste-estimaateissa, turvattomuuden mallissa Piste-estimaatit • Täyden mallin kontekstimuuttujat – Ruudun SES (Ruututietokanta): low (ref.) – mid - hi – Lähiöruutu: 0/1, (Mats Stjernberg 2013) • Täysi OLS – SES, hi: – Lähiö: .363 (p < .0005) -.082 (p=.001) (turvallisempi) (turvattomampi) • Täydet spatiaaliset mallit – SES, hi: – Lähiö: .200 (viive) / .240 (virhe) (p < .0005) -.043 (viive) / -.037 (virhe) (ns) Mahdollinen ongelma • Kaksitasoinen aineisto + spatiaalinen rakenne • Spatiaaliset mallit & tyypillisesti yksitasoinen aineisto • Tässä juuri kontekstimuuttujat heilahtivat: tulkinta? • Monitasomalli mahdollisesti ongelmallinen: – Yksin ruudussa – Ruuturakenne on jatkuva ja korreloitunut (vrt. ryväsotos, riippumattomat ryppäät) • Uusi artikkeli ja uusi kokeilu Kiitos! Esitys perustuu Sosiaalilääketieteellisessä aikakauslehdessä julkaistavaan artikkeliin: Kemppainen, Teemu (2014): Spatiaalista mallinnusta pistedatalla: kyselypohjainen analyysi koetusta terveydestä ja turvattomuudesta Helsingin metropolialueella. Tutkimus on osa Suomen Akatemian rahoittamaa PREFARE-projektia. teemu.t.kemppainen(at)helsinki.fi
© Copyright 2024