Hyvän tilastografiikan vaatimukset

Tilastografiikan sudenkuopat
- millaista on hyvä tilastografiikka?
Datajournalismin kurssi 25.11.2011
Heli Mikkelä
[email protected]
Tilastotiedon esittämistavat
 Miksi grafiikkaa?
 Tilastografiikan elementit
 Tilastograafisen esityksen perustyypit
 Esimerkkejä
 Esittämistavan/Grafiikkatyypin valinta - yhteenveto
 Aineistoa ja lähteitä

TP/HMikkelä Marraskuu 2011
25.11.2011
Tilastotiedon/asiantuntijatiedon esittäminen
Tilastotiedon esittämisen keinot:
 teksti
 taulukko
 kuvio
 Roolit ja luonteet: nopeus, tarkkuus, havainnollisuus,
korostus, valinnat/poiminnat, kuvattava ilmiö,
subjektiivisuus, erittely/yhdistelytarve
 Yleensä paras tulos sopivalla yhdistelmällä

TP/HMikkelä Marraskuu 2011
25.11.2011
Tekstin piirteitä
Mahdollistaa taustoituksen, analyysin, asioiden
välisten suhteiden kuvaamisen
 On aina subjektiivinen ja sisältää tulkintaa
 Teksti tekstinä, esimerkiksi
 ei ole tarkoituksenmukaista kirjoittaa taulukkoa tai
kuvaa auki tekstiin
 tekstissä kuvataan ilmiötä, ei kuvion viivan suuntaa
tai taulukon numeroiden muutoksia

TP/HMikkelä Marraskuu 2011
25.11.2011
Taulukon piirteitä
Objektiivisin menetelmä
 Tarkkuus – valittavissa tilanteen mukaan
 Yhdisteltävyys, vertailtavuus
 Syventyminen
 Laajat kokonaisuudet ja monimutkaiset tietorakenteet
 Tiivistää ja yhdistää
 Mahdollistaa lukijan omat analyysit

TP/HMikkelä Marraskuu 2011
25.11.2011
Kuvan/ graafin piirteitä

Tilastograafin tehtävä: tiedon esittäminen visuaalisesti
Kommunikoivat nopeasti ja suoraan
 Korostavat loppuun saatettuja, johdonmukaisia ja
ratkaisevia viestejä
 Mahdollistavat nopean vertailun
 Ovat vakuuttavampia
 Ovat paljastavampia
 Kiinnittävät huomiota ja pitävät huomiota yllä

TP/HMikkelä Marraskuu 2011
25.11.2011
Kuvat / graafit 2
Aineiston rakenteellisten ominaisuuksien esittäminen
 Suurten tietomäärien tiivistäminen
 Asioiden välisten kytkentöjen esittäminen
 Ajatusten ja johtopäätösten välittäminen
 Tunnelman luominen
 Kulttuurisidonnaisuus
 Fyysisen havaintokyvyn rajat ja puutteet
 Joitakin ilmiöitä voidaan esittää vain kuviolla
 Voi olla helppo tai vaikea, yksiselitteinen tai
monitulkintainen =>”Yksinkertainen on kaunista”

TP/HMikkelä Marraskuu 2011
25.11.2011
Kuvat vs taulukko
4,0
7,0
10,0
12,0
14,0
15,1
14,9
13,0
11,0
21,1
7,8
21,4
7,1
17,3
8,7
16,7
8,5
20,8
7,6
20,3
6,7
17,2
8,1
17,3
8,3
20
7,7
19,1
7,2
TP/HMikkelä Marraskuu 2011
25.11.2011
Kuvat vs taulukko
4,0
7,0
10,0
12,0
14,0
15,1
14,9
13,0
11,0
16,0
14,0
12,0
10,0
8,0
6,0
4,0
2,0
0,0
0
5
10
20
21,1
7,8
21,4
7,1
17,3
8,7
16,7
8,5
20,8
7,6
20,3
6,7
10
17,2
8,1
8
17,3
8,3
6
20
7,7
4
19,1
7,2
2
18
16
14
12
0
0
2
TP/HMikkelä Marraskuu 2011
4
6
25.11.2011
8
10
Kuva vertailee
A
60
50
40
30
20
10
0
1
TP/HMikkelä Marraskuu 2011
25.11.2011
Kuva vertailee
120
A
60
100
50
80
40
60
30
20
40
10
20
0
1
0
A
TP/HMikkelä Marraskuu 2011
B
25.11.2011
Kuva vertailee
120
A
60
100
50
80
40
60
30
20
40
10
20
0
1
0
A
Vuonna 2001 hinta oli 50 euroa
B
Vuonna 2002 hinta oli kaksi
kertaa niin suuri kuin 2001
TP/HMikkelä Marraskuu 2011
25.11.2011
Kuvien lukeminen
havaintopsykologia: tiedostettu ja tiedostamaton
havainnointi
 kohdelähtöinen ja kokijalähtöinen tulkinta
 tilastokuvioiden kuvioelementit vakioituneita =>
kuviokieli: symbolit, symbolien yhteiskäyttö, symbolien
kykeytyminen määrään tai suuruuteen
 määrä: pinta-ala, pituudet, suunnat, kulmien suuruudet
ja värikylläisyys

TP/HMikkelä Marraskuu 2011
25.11.2011
Grafiikan rakenne ja peruselementit
Kuviot tehdään usein suorakulmaiseen
koordinaatistoon
 Historian mukanaan tuomat sopimukset
 Perusrakenne on konventio => lukukelpoisuus
 Kuvioiden rakenteen kaksi kokonaisuutta
 kuvion piirrososat eli itse kuvio = määrällinen
informaatio
 kuvion tekstit = liittymä todellisuuteen, tulkittavuus

TP/HMikkelä Marraskuu 2011
25.11.2011
Grafiikan elementit, 2
Akselin otsikko
ja/tai mittayksikkö
Otsikko
Pysty- eli
y-akseli
Hilaviivat
Asteikko
Asteikkosuorakulmio
Tietoalkiot/
tietoviivat
Tietosuorakulmio
Asteikkopisteiden
nimiöt
Vaaka eli
x-akseli ja mittayksikkö
Selite
Vuosi
Alaviite
Tietoalkioiden nimiöt
TP/HMikkelä Marraskuu 2011
25.11.2011
Hyvän tilastografiikan arviointi

Tietotiheys

Valekerroin


Tieto-muste –suhde
 Itse asia vs. kuvioroina
Tehokkuus – silmän liike
TP/HMikkelä Marraskuu 2011
25.11.2011
Visuaalinen vertailtavuus

kuviossa olevien
kuvioelementtien
suhde on sama
kuin lukujen
suhde
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
KoImiulotteisuus
Tilavuuden vertailu on epätarkkaa
 Erimuotoisten kolmiulotteisten kappaleiden
tilavuuksien vertailu (pallo ja pyramidi) lähes
mahdotonta.
 Kolmiulotteisuus
 heikentää kuvioon sisältyvää visuaalista
vertailtavuutta
 ei paranna kuvion kykyä välittää tietoa

TP/HMikkelä Marraskuu 2011
25.11.2011
Uhanalaisten osuus (%)
Maatalous ja rakennetut…
Rannat
Vedet
Kalliot
Tunturit
Uhanalaisten osuus (%)
Suot
Metsät
Maatalous ja rakennetut…
0
5
10
Rannat
Vedet
Kalliot
Tunturit
Suot
Metsät
0
5
10
15
TP/HMikkelä Marraskuu 2011
25.11.2011
15
Grafiikkakuvioiden perustyylit
viiva
 pystypalkki (pylväs)
 vaakapalkki
 piirakka


muita: parvikuvio, teemakartat jne.
TP/HMikkelä Marraskuu 2011
25.11.2011
Viivakuvio (murtoviivakuvio)
korostaan kehityssuuntaa ja vaihtelua.
 trendit tai niiden puute korostuvat, kokonaismäärä jää
taustalle
 kummallakin akselilla jatkuva-arvoinen ja tasavälinen
asteikko

y-akselin ei välttämättä tarvitse alkaa nollasta
 aspektisuhde: tasaista kasvua kuvataan 45:n kulmalla

TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
18
16
14
12
10
8
6
4
2
0
määräaikaiset
osa-aikaiset
TP/HMikkelä Marraskuu 2011
25.11.2011
Pylväskuvio
korostaa määriä ja määrien vaihtelua
 soveltuu aikasarjojen kuvaamiseen
 akseleilla jatkuva-arvoinen ja tasavälinen asteikko
 y-akselia ei saa katkaista; pitkät pylväät katkaistaan
tarvittaessa ja merkitään luku näkyviin
 pylväiden väli 25-50 % niiden leveydestä
 ryhmissä korkeintaan 3 pylvästä vierekkäin
 viivakuvio ja pylväskuvio toistensa vaihtoehtoja
 viivakuvio trendit, sarjojen väliset suhteet
 pylväiden rasterointi: tummuusasteet ja sävyt parhaat

TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
Mielenterveyden häiriöt
Tuki- ja liikuntaelinten sairaudet
Verenkiertoelinten sairaudet
Muut sairaudet
90000
80000
70000
60000
50000
40000
30000
20000
10000
0
2004
2005
2006
2007
2008
TP/HMikkelä Marraskuu 2011
25.11.2011
300000
250000
200000
Mielenterveyden häiriöt
Tuki- ja liikuntaelinten sairaudet
150000
Verenkiertoelinten sairaudet
Muut sairaudet
yhteensä
100000
50000
0
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
TP/HMikkelä Marraskuu 2011
2008
25.11.2011
Pylväskuvio: vaaka-akselin leveyden ja
pylväiden leveyden vaikutus
250000
200000
150000
100000
50000
0
2004
2005
2006
2007
2008
TP/HMikkelä Marraskuu 2011
25.11.2011
Pylväskuvio: vaaka-akselin leveyden ja
pylväiden leveyden vaikutus
250000
250000
200000
200000
150000
150000
100000
100000
50000
50000
0
2004
2005
2006
2007
2008
0
2004
2005
2006
TP/HMikkelä Marraskuu 2011
2007
2008
25.11.2011
Pylväskuvio: vaaka-akselin leveyden ja
pylväiden leveyden vaikutus
250000
250000
200000
200000
150000
150000
100000
100000
50000
50000
0
2004
2005
2006
2007
250000
0
2008
2004
2005
2006
2007
2008
200000
150000
100000
50000
0
2004
2005
2006
2007
2008
TP/HMikkelä Marraskuu 2011
25.11.2011
18
16
14
12
10
8
6
4
2
0
määräaikaiset
osa-aikaiset
TP/HMikkelä Marraskuu 2011
25.11.2011
18
16
määräaikaiset
osa-aikaiset
14
12
10
8
6
4
2
0
TP/HMikkelä Marraskuu 2011
25.11.2011
Vaakapylväskuvio (palkkikuvio)
soveltuu eri luokkien määrän esittämiseen ja
vertailuun
 pystyakselilla yleensä luokitteleva (epäjatkuva)
ominaisuus, vaaka-akselilla määräasteikko
 aikasarjat voidaan esittää vaakapylväillä, ei tässä
tarkoituksessa yhtä havainnollinen kuin pystypylväikkö
 x-akselin asteikkoa ei saa katkaista
 pylväät suuruusjärjestykseen ellei luokilla ole
luonnollista järjestystä
 Vaaka- ja pystypylväskuvio eivät toistensa
vaihtoehtoja

TP/HMikkelä Marraskuu 2011
25.11.2011
Uhanalaisten osuus (%)
Tunturit
Maatalous ja rakennetut ympäristöt
Rannat
Kalliot
Vedet
Suot
Metsät
0
2
4
6
8
10
TP/HMikkelä Marraskuu 2011
12
14
25.11.2011
16
Uhanalaisten osuus (%)
Tunturit
Maatalous ja rakennetut ympäristöt
Rannat
Kalliot
Vedet
Suot
Metsät
0
2
4
6
8
10
TP/HMikkelä Marraskuu 2011
12
14
25.11.2011
16
Piirakkakuvio (ympyrädiagrammi)
osuuksien kuvaaminen
 ei asteikkoa, osuudet pinta-alojen suhteena
 epätarkin
 korkeintaan kuusi sektoria
 suuruusjärjestys suurimmasta pienimpään
 suurimmasta alkaen joko
 klo 12 myötäpäivään
 klo 3 vastapäivään /nykyisin yleisempi
 piirakoiden välinen vertailu vaikeaa

TP/HMikkelä Marraskuu 2011
25.11.2011
Suositus: mistä piirakkakuvion suurin osio alkaa
Muu tutkinto
3%
Ei tutkintoa,
opiskeli
58 %
Muu
tutkinto
3%
Ylempi
korkeakoul
u-tutkinto
23 %
Ei tutkintoa
eikä
opiskellut
7%
Alempi
korkeakoulututkinto
9%
Klo 3 vastapäivään
Ylempi
korkeakoulututkinto
23 %
Alempi
korkeakoulututkinto
9%
Ei tutkintoa,
opiskeli
58 %
Ei tutkintoa
eikä
opiskellut
7%
Klo 12 myötäpäivään
TP/HMikkelä Marraskuu 2011
25.11.2011
Esimerkkejä erilaisista kuvista
http://tilastokeskus.fi/til/mettp/2007/mettp_2007_2009-12-17_tie_001_fi.html
http://tilastokeskus.fi/til/hrah/2008/hrah_2008_2009-12-16_tie_001_fi.html
http://tilastokeskus.fi/til/merek/2009/11/merek_2009_11_2009-1204_tie_001.html
TP/HMikkelä Marraskuu 2011
25.11.2011
BAD EXAMPLE
of a line chart
Number of
students taking
English as a
second
language
at West High
School, by first
language
spoken, 1987 to
2002
Source: Statistics Canada, Learning
Resources: Using graphs5
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
Samat luvut, eri asteikko ja
skaalaus
25.11.2011
TP/HMikkelä Marraskuu 2011
Samat luvut, eri asteikko ja
skaalaus
25.11.2011
TP/HMikkelä Marraskuu 2011
Samat luvut, eri asteikko ja
skaalaus
25.11.2011
TP/HMikkelä Marraskuu 2011
Samat luvut, eri asteikko ja
skaalaus
25.11.2011
TP/HMikkelä Marraskuu 2011
TP/HMikkelä Marraskuu 2011
25.11.2011
Samat luvut, piirakka ja pylväät
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
Kauppalehti Optio 8/2010
TP/HMikkelä Marraskuu 2011
25.11.2011
Pohjolan
Sanomat
15.11.2011
TP/HMikkelä Marraskuu 2011
25.11.2011
3500
3000
2500
2000
1500
1000
500
0
Miehet
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
500
0
0
Miehet
Naiset
Sukupuolet
yhteensä
Naiset
Miehet
Sukupuolet
yhteensä
Naiset
TP/HMikkelä Marraskuu 2011
Sukupuolet
yhteensä
25.11.2011
3500
3000
2500
2000
1500
1000
500
0
Miehet
4000
Naiset
Sukupuolet
yhteensä
4000
3500
3500
3000
2500
3000
2000
1500
2500
1000
500
2000
0
Miehet
Naiset
Sukupuolet
yhteensä
TP/HMikkelä Marraskuu 2011
Miehet
Naiset
25.11.2011
Sukupuolet yhteensä
”Oikea esitystapa” 1

tietosisällöltään oikein

kieli-, väri- ja muoto-opillisesta oikein

oikeassa suhteessa kohderyhmään

oikeassa suhteessa viestinnän tavoitteeseen

oikeassa suhteessa käytettävissä olevaan aikaan
TP/HMikkelä Marraskuu 2011
25.11.2011
”Oikea esitystapa” 2

tyylilajiltaan oikea

(teknisesti) julkaisuvälineen kanssa yhteensopiva

oikeaan aikaan oikeassa paikassa

rakenteellisesti selkeä

visuaalisesti luettava
TP/HMikkelä Marraskuu 2011
25.11.2011
Grafiikkatyypin valinta, yhteenveto 1
esitystilanne
 esitettävän tiedon luonne
 sanoma, jonka haluaa välittää
 Grafiikan asema ja rooli kokonaisesityksessä
 tietoalkion luonne (lukumäärät, prosentit, keskiarvo..)
 muuttujien määrä
 muuttujien mitta-asteikko

TP/HMikkelä Marraskuu 2011
25.11.2011
Grafiikkatyypin valinta, yhteenveto 2
luokiteltujen muuttujien asteikkotyyppi ja luokkien
määrä
 jatkuvuus/epäjatkuvuus
 järjestysasteikko vs. ihmisten lukutapa
 värit – symboliikka, kylläisyys, värisokeus,
tulostus/kopiointi mustavalkoisena…
 hilaviivat
 ”apuviivat”, esim. vertailuarvo
 asteikko kummassakin reunassa
 ei kahta mittayksikköä samaan kuvaan…
 ei kolmiulotteisuutta
 liikkuvaa kuvaa/animaatiota – mutta harkiten!

TP/HMikkelä Marraskuu 2011
25.11.2011
Visualisointiesimerkki vuodelta1949
TP/HMikkelä Marraskuu 2011
25.11.2011
Aineistoja, lähteitä, luettavaa







Kuusela Vesa. 2000: Tilastografiikan perusteet. Edita
Tilastokeskuksen verkkokoulu. Tilastografiikan perusteet.
http://www.tilastokeskus.fi/tup/verkkokoulu/data/tg/index.html
Tufte Edward. The Visual Display of Quantitative Information
Malamed, Connie. 2009. Visual language for designers (yleisempi teos)
http://www.niemanlab.org/2011/10/word-clouds-considered-harmful/
McCandless, David. Tieto on kaunista. Kustannusosakeyhtiö Nemo 2009.
UNECE:
 Making Data Meaningful. A guide to writing stories about numbers.
 Making Data Meaningful 2. Style guide on presentation of statistics.
 http://www.unece.org/stats/documents/writing/
TP/HMikkelä Marraskuu 2011
25.11.2011