Johdanto paikkatietoanalyysiin

Johdanto paikkatietoanalyysiin
Kirsi Virrantaus
Maa-123.3510 GIS Analysis &
Modelling (5 cr)
Introduction to Geographic
Information Analysis
Kirsi Virrantaus
Maa-123.3510 GIS Analysis &
Modelling (5 cr)
0. Esimerkki
• Geoinformatiikan tutkimusryhmässä kehitetty
GIS-analyysisovellus (J-Nikander, väitöskirja)
• aiheena maaston kulkukelpoisuuden analysointi
maastotietojen perusteella
• maaperä, korkeusmalli ja kasvillisuuden määrä
• menetelmä perustuu klusterointiin (oletetaan, että
jos alueilla vallitsee samanlaiset maasto-olosuhteet
niin ne ovat kulkukelpoisuudeltaankin
samanlaisia) sekä visualisointiin ja interaktioon
0. Example
• an analysis method developed in the Research
Group of Geoinformatics (J.Nikander, doctoral
thesis)
• topic: cross-country mobility analysis based on
terrain data
• soil map, elevation model, vegetation data
• method is based on clustering (we assume that if
two regions have equal terrain they also are equal
in the mobility plus visualization and interaction
Visuaaliset menetelmät
analyysityökaluna
• visualisointi on usein helppo ja nopea mutta
subjektiivinen työkalu
• on tilanteita, joissa laskennallinen analyysi on liian
työlästä/turhaa
• voidaan hyödyntää GIS-järjestelmän
visuaalisuutta
• käyttäjän subjektiivisuus voi olla hallinnassa
• eksploratiivinen analyysi: ohjelmisto suorittaa
automaattisia laskentoja ja visualisoi, käyttäjä
tekee johtopäätöksiä ja valitsee toimintoja
Visual methods in spatial analysis
• visualization is often easy and quick but subjective
tool
• there are situations where computational analysis
is not necessary/efficient
• the visuality of GIS can be utilized
• the subjectivity of the user can be under control
• explorative analysis: the software performs
automatic analyses and visualize the results, the
user the makes decisions and select new functions
to be performed
Esimerkin tarkastelua
• edellisessä esimerkissä käytettiin
– monimuuttujadatan visualisointia PCPmenetelmällä (parallel coordinate plot),
– karttaa
– vuorovaikutusta (käyttäjän valintoja)
– laskentaa (klusterointi)
• tyypillinen spatiaalianalyysin tapaus
• visualisointi, laskenta ja käyttäjän päätökset
muodostavat analyysiprosessin
In the previous example
• we used
– multivariate visualization method (PCP,
parallell coordinate plot)
– map
– user interaction (decisions)
– computation (clustering)
• this is a typical example of spatial analysis process
• visualization, computing and users decisions make
an analysis process
Tieteellinen visualisointi –
eksploratiivnen data-analyysi,
visuaalinen analyysi
• tieteellinen visualisointi: graafinen datan ja
informaation tutkiminen tavoitteena ymmärryksen
ja oivalluksen aikaansaaminen
• eksploratiivisessa data-analyysissä kartat eivät ole
tulosten esittämistä vaan analyysin välineitä
• geoinformatiikassa käytetään “visuaalisen
analyysin” termiä tässä yhteydessä
Scientific visualization – explorative
analysis, visual analytics
• scientific visualization : exploring data and
information graphically as a means of gaining
understanding and insight
• in explorative data analysis maps are tools for
analysis not for presentation of results
• in geoinformatics the term “visual analytics” is
used (inludes also computation)
First lecture structure
• 1. Motivation
• 2. Intro to the taxonomy of methods and the text
book (O´Sullivan & Unwin, Geographic
Information Analysis, 2003) – Intro to the text
book
–
–
–
–
Spatial manipulations
Spatial data analysis
Spatial statistical analysis
Spatial models
1. Motivation: Why Spatial analysis?
• in order to understand and explain the events and
phenomena in the world
• we want to explain the reasons/causes and predict the
future
• we need to study the phenomenon itself and the
environment in which the events take place
• for that we need verified and validated models that are
based on reliable data and scientific methods
Why Spatial is special?
• each object/event in our world happens
– in some location (x,y,z) and
– at some time (t)
• => in a spatio-temporal space
• in order to model the objects in this space we need spatial
and spatio-temporal relationships
• the elementary objects between which the spatial
relationships are defined are:
– points, lines and polygons(areas)
• the core difference between spatial and non-spatial
objects/events is realized in these spatial relationships
Space-time cube
Hägerstrand, 1970
Nowadays implemented in analysis softwares
http://www.r-bloggers.com/r-interactive-3d-webgl-plot-of-time-space-cube-with-rgl/
Example on spatio-temporal data in space-time cube.
Trajectories of ships in space-time cube (Demsar&Virrantaus,201
Some spatial relationships
• distance between two locations, the length of the connecting line; d
• direction of a line connecting two locations; α
• proximity defined by for example the circle around an object
defined by the radius or another polygonal shape around the object that
can be exactly defined for example by a function or by geometry
• distance, direction and proximity are metric relationships
• adjacency defined by for example the common boundary line
between two polygons or end point of two lines, can also be defined in
higher orders
• connectivity (see also contiguity) is a more general concept having
various definitions in various field of science; in geoinformatics
connectivity is very similar concept to adjacency and even proximity
• adjacency and connectivity are topological relationhisps, (they
represent relationships that remain even when the spatial reference is
distorted (rubber sheet effect))
Spatiaaliset ja topologiset relaatiot
• ”Spatiaaliset relaatiot kuvaavat millaisessa sijainnillisessa
suhteessa spatiaalinen kohde on toisiin spatiaalisiin
kohteisiin”
• ”Topologia on matematiikan osa-alue, jota käytetään
vektorimaisten geometristen kohteiden eheyden
validointiin, verkko-operaatioiden tai polygoniverkkojen
prosessoinnin suorittamiseen”
• ”Topologia on ominaisuus, joka säilyy vaikka spatiaalista
referenssiä venytetään tai vääristetään”
Spatial relationships and analysis
• Spatial relationships are the core concepts in spatial data
modeling but also in spatial analysis
• Simple analyses
– can be made just based on these relationships and geometry;
• quite often the data has been organized into a topological
data structure (DIME;DCEL)
– in order to support computation of simple manipulation
operations:
• map overlay, point-in-polygon, nearest neighbour,shortest path
…continues
• In spatial data analysis, spatio-statistical analysis and
modelling
– more advanced methods are used
– spatial relationships are still in the core role
• For example adjacency relationship is used when spatial
autocorrelation is analysed
– It is often used in the form of W (weight/adjacency matrix)
Spatial phenomena are special
• real world is not homogeneous platform for phenomena
– physical structures, barriers, obstacles; terrain,
vegetation, waters
– human behaviour; people tend to group in cities, villages
etc.
• In Geography and spatial analysis this is modeled by the
concept of spatial autocorrelation
– ” things close to each others tend to be more similar than things
further from each others” (1st law of Geography, Tobler´s law)
• spatial autocorrelation is modeled by the concept of
interaction; interaction is measured by distance and the
objects of interest are identified by adjacency relationship
Small exercise
• Think what is the difference between
– Distance and
– Adjacency
• Why we need the adjacency relationship?
Why distance is not enough?
Specialities of spatiality for analysis
• Spatial relationhips
– must be somehow implemented in the analysis methods
– by data structure or computation
• Spatial autocorrelation
– must be taken into account in the analysis methods and
processes
– the assumption of ”complete spatial randomness” can
not straightforwardly be used
When analysing graphs (networks) the topological
data structure is essential (Tiet – Digiroad)
ZhangZhe, 2010
• when modeling graphs graph topology (=
connectivity between lines) is of major interest
• if the graph structure is not consistent (=if the
topology has mot been correctly modeled) graph
analyses (like shortest path) can not be computed
• quality element: consistency
Small exercise
• What happens in graph analyses if the road
network topology is not correct ?
• How the topology can be automatically
created in a non-topological data set ?
The Quarternary deposits map (Maalajikartta) is a
good example of spatial autocorrelation
Sunila,R., 2009
Small exercise
• What kind of topological relationship is of
core importance in the previous data set?
– Spatial elements?
– Relationship in the model ?
2. Luennon sisältö – keskeisiä
käsitteitä
• Spatiaalisen datan
manipulointi
• Spatiaalinen data-analyysi
• Spatiaalinen tilastollinen
analyysi
• Spatiaalinen mallinnus
• Spatiaaaliset prosessit ja niiden
kuvaukset
• Riippumaton stokastinen
prosessi
• Geometria, ominaisuudet,
topologia
• Voronoi-diagrammi
• Pinnan mitat
• Spatiaalinen autokorrelaatio
• Variogrammipilvi
• Ensimmäisen ja toisen asteen
efektit
• Sationäärisyys, isotrooppisuus
2. Contents – core concepts
• Manipulation of spatial
data (by using GIS)
• Spatial data analysis
(explorative, descriptive)
• Spatial statistical analysis
(applied statistical
method)
• Spatial modelling
(predicts spatial outcomes)
•
•
•
•
•
•
•
•
•
Spatial processes and patterns
Independent stochastic process
Geometry, attributes, topology
Voronoi-diagrams
Measures of surfaces
Spatial autocorrelation
Variogram cloud
First and second order effects
Stationarity, isotropy
Analyysit geoinformaatiotieteeteessä
• GIS-historian lähtökohta: kvantitatiivinen maantiede,
analyyttinen kartografia
– pisteiden, viivojen ja alueiden geometrinen,
tilastomatemaattinen ja verkkoteoriaan pohjautuva
analyysi
• GIS järjestelmät: laajat paikkatieto-aineistot
• GIS-ohjelmistot: visualisointityökalut ja spatiaalisen data
ns. manipulointityökalut
– eivät sisällä spatiaalisen analyysin ja mallinnuksen
kehittyneitä työkaluja – tämä on nyt muuttumassa,
kehittyneempiä menetelmiä tulee ohjelmistoihin
Spatial analysis in GIScience
• spatial analysis has a history longer than GIS
• SA is actually the starting point of GIS: quantitative
geography, analytical cartography
– analysis of points, lines and areas, based on geometry, statistics
and graph theory
• GIS systems: data bases
• GIS software: visualization and spatial data manipulation
tools
– GIS analysis toolboxes in the commercial software do not inlcude
advanced spatial analysis and modeling possibilities – this is now
chaging, more methods are sooffered by softwares
• ”GIS is data rich but theory poor” (Openshaw) – ei enää
pidä täysin paikkaansa
• GIS –ohjelmistojen toiminnallisuudet:
– aritmetiikkaan ja geometriaan perustuvia laskentoja
– puskuroinnit, overlayt, lyhimmät reitit, näkyvyydet
• analyysissä tarvitaan data-analyysiä, tilastollista analyysiä,
matemaattista mallinnusta sekä datan ja tulosten
epävarmuuden tarkastelua, koko päätöksentekoprosessin
analysointia
• ”GIS is data rich but theory poor” (Openshaw) – no more
true
• more advanced methods are required than the
functionalities in GIS software:
– measurements based on arithmetics and geometry
– buffers, overlays, shortest paths, visibility
• advanced data analysis, statistical analysis and
mathematical modeling
• analysis of the uncertainlty of source data as well as the
reliability of the results
• analysis of the spatial decision making process
• In our curriculum: this course +
• Spatial data Mining –course, Uncertainty in GI –course,
Visual analytics -course
Analyysimenetelmistä
• Menetelmä riippuu käytetystä tietomallista
• Menetelmään vaikuttaa
– Geometrian mallinnus; objekti, kenttä
– Topologian mallinnus; millaisia relaatioita mallissa on
– Ominaisuuksien määrä ja tyyppi
• Oppikirjan menetelmäluokittelu
About the analysis methods
• Selection of the analysis method to be used is limited by
– The data model used; object or field model
– The topological relations in the model
– The amount and type of attributes
• Classification of the analysis methods into four classes in
the Text Book
Analyysimenetelmä riippuu
tietomallista
• paikkatiedot mallinnetaan objekteina tai kenttinä
• objektit, kohteet (objects)
– pistemäisiä, viivamaisia, aluemaisia ja näistä koostuvia
diskreettejä kokonaisuuksia
• kentät, jatkumot (fields)
– jatkuvia ilmiöitä kuvaavaa dataa
– jatkuva malli
• esim. korkeusmalli
– luokkamuuttujadata
• esim. maalajikartta
Analysis method depends on the
spatial data model
• geographical information is modeled as
• objects
– points, lines, polygons and discrete combinations of
these
• fields
– data on continuous phenomena
– continuous model
• for example elevation model
– categorical variables
• for example soil map
Spatiaalisen datan erityispiirteet
•
•
•
•
geometria
ominaisuudet
topologia
kohdemaisen kuvaamisen ongelmia:
– samaa kohdetta joudutaan kuvaamaan eri tavoin eri
mittakaavassa ja eri sovelluksia varten
– kaikki kohteet eivät ole tarkkarajaisia: sumea mallinnus
What is special in spatial data
•
•
•
•
geometry
attributes
topology / relationships
problems in object models:
– multiple representation problem for varying scales and
various applications
– all objects are not crisp; fuzzy models
Geometria, topologia, ominaisuudet
• etäisyys, suunta
• viereisyys, yhdistävyys
• erityisiä pintojen ominaisuuksien mittoja kuten kaltevuus,
aspekti; analyysejä kuten näkemäalue, LOS = ”line of
sight”, näkemäviiva
• spatiaalisia ominaisuuksia voidaan kuvata mm.
viereisyysmatriisilla, Thiessen/Voronoi polygoneilla –
erityiset tietorakenteet näihin
• ominaisuuksien mittaamiseen nominaali, järjestys,
välimatka ja suhde -asteikot
Geometry, topology, attributes
• distance, direction
• adjacency, connectivity
• measures of surfaces: slope,aspect; analyses like viewshed
and LOS
• spatial characteristics can be described for example by
matrices or Voronoi/Thiessen diagrams – spatial data
structures
• measuring attributes by nominal, ordinal, incremental and
ratio scales
Attribute measures
• Nominal (categorical)
– inclusive and mutually exclusive categories
• Ordinal (categorical)
– can be ranked according to some criterion; order but no
difference
• Interval
– differences/distance between categories can be defined
by fixed units
• Ratio
– ratio scale has an absolute zero
Ominaisuustiedon mittaaminen
• Nominaaliasteikko
– vain laatu
• Järjestysasteikko
– laatu ja järjestys
• Välimatka-asteikko
– järjestystä voidaan mitata vakioyksiköllä
– nollapiste mielivaltaisesti valittu
• Suhdeasteikko
– absoluuttinen nollapiste
Oppikirjassa jaotellaan menetelmät:
• 1. spatiaalisen datan manipulointi
– kaupallisten tuotteiden toiminnallisuudet
• 2. spatiaalinen data-analyysi
– eksploratiivistä ja kuvailevaa
• 3. spatiaalinen tilastollinen analyysi
– todellisen datan testaaminen tilastollisten mallien
avulla
• 3. spatiaalinen mallinnus
– spatiaalisten ilmiöiden käyttäytymisen ennustaminen
The classification of methods used in
our textbook:
• I
spatial data manipulation
– (simple) functionalities in GIS –analysis toolboxes
• II spatial data-analysis
– explorative and descriptive
• III spatial statistical analysis
– comparing the data with statistical models
• IV spatial modeling
– predicting the behaviour or spatial phenomena by
models
I Paikkatiedon ”manipulointi”
• vektorikohteiden (piste, viiva, alue) geometriaan
tukeutuvat laskennat
– etäisyydet, puskurit, piste alueessa jne.
• verkkopohjaiset yksinkertaiset ongelmat
• rasterimuotoinen analyysi
– map algebra (Tomlin)
– vrt. filtterit - kuvankäsittelyä
• yksinkertaista tilastollista ja geostatistista käsittelyä –
joitain funktioita
I Manipulation of GI
• measurements and calculations based on vector objects
(point, line, polygon)
– distances, buffering, point-in-polygon, overlays etc.
• basic graph problems
• raster/grid analysis
– map algebra (Tomlin)
– image processing
• only simple statistics and geostatistics – some functions
– mean
Esimerkkejä
manipulointitoiminnallisuuksista
• verkoille: linkeille, solmuille
– janojen leikkaus, piste viivalla, vyöhykkeet,
yleistys
– segmentointi, geometriasta topologiaksi
• rasterille: pikselille, naapuruusalueelle, koko
tasolle, aluejaolle (local, focal, zonal)
– uudelleenluokittelu, uudelleenkoodaus,
vaihtelu, vallitsevuus, interpolointi
Examples of basic manipulation
functions
• graphs: links, nodes
– intersections, point-in-line, buffers,
generalization
– segmenting, from geometry to topology
• rasters: pixel, neighbourhood, entire layer,
zoning (local, focal, zonal)
– reclassification, recoding, interpolation
...jatkuu
• Alueille, aluejaoille
– “point-in-polygon”, piste aluejaossa,
keskipiste/referenssipiste, janan ja alueen
leikkaus, alueiden unioni ja leikkaus, alueen
ikkunointi, vyöhykkeet, “polygon overlay”,
pinta-ala, alueesta pisteeksi,
tietorakennemuunnokset
• Pisteille, pistejoukoille
– lähin piste, lähimmät pisteparit
...continues
• polygons, polygon networks
– “point-in-polygon”, point-in-polygonmap,
center /reference point, line-in-polygon, union
and intersection of polygons, windowing a
polygon, buffers, “polygon overlay”, area,
from polygon to point, data structure
conversions
• points, point sets
– nearest point, closest point pairs
Esimerkkejä ohjelmistojen
valmiista analyysisovelluksista
• Verkolle, esim. tieverkko
– lyhin reitti, kauppamatkustajan ongelma,
sijoitteluongelma, virittävä puu
• Rasterille, esim. korkeusmalli
– “proximal areas”, kustannuspinta ja
kulkureitin optimointi, näkyvyysalueet, valuma
• Alueet ja aluejaot, esim. tilastoaluejako
– “map overlay”, aluejakojen luominen
Examples of ready made analysis
applications in GIS-software
• graphs, for example road networks
– shortest path, traveling salesman, location problems,
spanning tree
• rasters, for example elevation model
– “proximal areas”, cost surface and path optimizing,
visibility areas, drainage
• polygons and polygon networks, for example
statistical map
– “map overlay”, creating of polygon maps
• pisteille, pistejoukoille, esim.
korkeuspisteet, maaperätutkimuspisteet
– pistejoukosta Voronoi -polygoniksi,
pistejoukosta kolmioverkoksi, pistejoukosta
matriisiksi
• points, point sets, for example height points,
soil investigation points
– from a point set to a Voronoi polygon map,
from a point set to a TIN, from a point set to a
matrix
GIS -ohjelmistot
• ohjelmistot tarjoavat toolboxin valmiita funktioita ja pieniä
ongelmanratkaisusovelluksia
• kun ohjelmistot tarjoavat valmiita toiminnallisuuksia on
suuri vaara, että ryhdytään käyttämään valmiita
toiminnallisuuksia analysoimatta ongelmaa
• saatetaan ratkaista hienosti, mutta väärä ongelma
• lisäksi valmisohjelmistojen toiminnallisuudet eivät ole aina
dokumentoituja, algoritmejä ei tunneta täsmällisesti,
algoritmi voi olla huono
Problems with using the existing
commercial GIS sotware
• they offer a nice toolbox of ready-made functionalities and
problem solving applications
• it is very temptating just to apply the tools without
profound analysis of the problem
• you can get a nice solution to a wrong problem !
• commercial software functions are not always well
documented, the algorithms are not known; the algorithm
can be just bad
II Spatiaalinen data-analyysi
• spatiaalinen data-analyysi
– kuvataan prosesseja ja ilmiöiden esiintymisen
muotoja/kuvioita tilastollisin tunnusluvuin, ei
hypoteesia, ei testausta
• eksploratiivinen analyysi – tilastolliset menetelmät,
visualisointi ja interaktio, visuaalinen analyysi (edellinen
esimerkki onnettomuuksista)
– kartat analyysin työkaluina, ei vain tulosten esittäjinä
II Spatial data-analysis
• spatial data analysis
– describing spatial data by using statistical measures, no
hypothesis, no testing
• explorative data analysis (EDA) – statistical methods,
visualization and interaction, visual analysis (the given
example on incidents)
– maps as analysis tools and not only for presentation of
the results
Esimerkkejä spatiaalisista dataanalyysimenetelmistä
• Kernel –menetelmän käyttö klusterointiin,
hotspottien tunnistamiseen (cold spot)
– menetelmä perustuu matemaattisen funktion käyttöön
– menetelmän oikea käyttö pohjautuu käyttäjän
asiantuntemukseen ja interaktioon
• bandwidth
– tulosten tulkinta visuaalisesti
• Moranin indeksi kertoo onko autokorrelaatiota
• variogrammipilven käyttö spatiaalisen
autokorrrelaation toteamiseen (kirjan esimerkki)
Examples of spatial data-analysis
• using of Kernel –density mapping for identifying
clusters
– this method uses some mathematics for the model
– however the correct use is based on the users
experience and interaction
• bandwidth
– the results are interpreted visually
• Moran´s I for testing autocorrelation
• using variogram clouds for identifying spatial
autocorrelation (example in the book)
Hot spot, klusteri
• Hot spot
– Hot spot on alue, jossa esiintyy keskiarvoa
enemmän tutkittavaa asiaa/kohdetta
– Vastakohta cold spot
• Klusteri
– Klusteroinnissa pyritään kohteet jakamaan
mahdollisimman samankaltaisiin ryhmiin
ominaisuuksiensa perusteella
Hot spot, cluster
• Hot spot / cold spot
– In hot spot there can be found more than
average amount of the objects/events of interest
– Cold spot is the opposite for hot spot
• Cluster
– In clustering the objects are divided into groups
that are as similar than possible according to
their attribite values
Kernel-menetelmän käyttö (Krisp)
• Kernel menetelmä
• yksittäisistä havainnoista
• tiheyspinnaksi
yksittäiset havainnot
tiheyspinta
Kernel-säteen valinta (Krisp)
• Mitä suurempi säde
sitä yleistetympi esitys
• Pieni säde näyttää
enemmän
yksityiskohtia
• Kernel-mentelmä on
yksinkertainen ja
helppo käyttää, mutta
oikea käyttö vaatii
menetelmän
käyttäytymisen
ymmärtämistä
Spatiaalinen autokorrelaatio
• toisiaan lähellä olevat kohteet ovat
samanlaisempia kuin kaukana olevat
– spatiaalinen data ei ole satunnaisesti
jakautunutta
– positiivinen, negatiivinen tai nollaautokorrelaatio
• autokorrelaation mittoja
– Moran´s I, variogrammipilvi
Spatial autocorrelation
• data near each others are more likely to be
similar that data remote each others
– nonrandom distribution of spatial data
– positive, negative or 0-autocorrelation
• Measures for autocorrelation
– Moran´s I
– Variogram cloud
Variogrammipilvi
• ilmentää ominaisuuden ja sijainnin välistä suhdetta
• esim. kuvat 2.6 ja 2.7 kirjassa
– maaston harjumainen rakenne korkeuskäyrinä (kuva
2.6) ja korkeusdata sijaintiin suhteutettuna
variogrammikuvana (2.7)
– kaikille mahdollisille pistepareille lasketaan
korkeustiedon eron neliöjuuri (y) ja sijoitetaan arvo
pisteiden etäisyyden mukaan (x)
– variogrammipilvi ilmaisee autokorrelaation
Variogram cloud
• reflects the relationships between attribute values and
spatial location of the entities in the data set
• examples in the figures 2.6 and 2.7 in the text book
– terrain as a contour map (2.6)
– same data organized as a variogram cloud: for all
possible point pairs the square root of the difference in
their heights is plotted against the distance they are
apart
– interpretation of the variogram cloud tells about the
autocorrelation in the data set
O´Sullivan &Unwin, 2003)
O´Sullivan &Unwin, 200
O´Sullivan &Unwin, 200
…
• analysoidaan itä-länsi suuntaa ja pohjois-etelä- suuntaa
– esimerkissä nähdään, että pohjois-eteläsuunnassa
olevien pisteparien korkeuserot ovat suurempia kuin
itä-länsisuunnassa olevien pisteparien; vastaa
korkeuskäyräesitystä
– tätä ilmiötä nimitetään anisotropiaksi; datan
spatiaalisessa vaihtelussa on suuntaan liittyvä piirre
…
• analysis of N-S and W-E oriented pairs
– in the Fig 2.8 we can see that the differences between N-S oriented
pairs are greater that between E-W oriented pairs; matches with the
contour maps
– this phenomenon is called as anisotropy = there is a directional
effect in the spatial variation of the data
III (luku3) Spatiaalitilastollisessa
analyysissä ilmiöt mallinnetaan
prosesseina
• aineistoja analysoidaan suhteessa tilastollisiin malleihin –
haetaan tyypillistä ja ei-tyypillistä käyttäytymistä
• aineisto (kartta) on prosessin realisaatio
• esim.pistekartta on tietyn pisteprosessin realisaatio
– esimerkki: ”Suomen asukkaat” voidaan mallintaa
pisteprosessina ja pistekartta, joka kuvaa pisteenä
jokaisen asukkaan on tämän prosessin realisaatio
• spatiaalisia prosesseja voidaan kuvata matemaattisilla
malleilla
– deterministisillä tai stokastisilla
III In spatiostatistical analysis
phenomena as processes (Ch3)
• spatial data are analysed in order to find typical or
unexpected behaviour
• (data)patterns (maps) are realizations of processes
• for example dot map is a realization of a point process
– “Inhabitants of Finland” can be modeled as a point
process and the dot map showing each citizen is the
realization of that process
• spatial processes can be modeled by mathematical models
– deterministic or stochastic
Kuvio kartalla, hypoteesi ja sen
testaus
• havaittu data, karttaesitys, on eräs mahdollisista kuvioista,
jotka ilmiötä hypoteettisesti kuvaava prosessi saattaa
tuottaa
• spatiaalinen prosessi on kuvaus siitä, kuinka spatiaaliset
kuviot (pattern), joita esitetään kartoilla, ovat saattaneet
syntyä
Pattern on a map, hypothesis and
testing
• an observed map pattern is one of the possible patterns that
might have been generated by the hypothesised process
• a spatial process is a description of how a spatial patterns
might be generated
GIS-JÄRJESTELMÄÄN
TALLENNETUN
DATA N
VISUALISOITEJA
DESKRIPTIIVISET JA
EKSPLORATIIVISET
MENETELMÄT
NOSTAVAT
KYSYMYKSIÄ
HYPOTEESIEN
TILASTOLLINEN
TESTAUS
TEORIOITA
JA
MALLEJA
DATA
STORED
VISUALIZED
IN A GIS
DESCRIPTIVE AND
EXPLORATIVE
METHODS
RAISE
QUESTIONS
HYPOTHESISAND
STATISTICAL
TESTING
THEORIES
AND
MODELS
Deterministinen ja stokastinen
prosessi
• esimerkiksi yhtälö: z = 2x + 3y
• yhtälö saa aina samoilla muuttujien lähtöarvoilla aina
saman tuloksen = determnistinen prosessi
• kun yhtälöön lisätään satunnainen komponentti, voidaan
saada erilaisia tuloksia eri realisaatioissa, samoilla
lähtöarvoilla = stokastinen prosessi
• esimerkiksi: z = 2x + 3y ± 1
Deterministic and stochastic process
• For example the equation: z = 2x + 3y
• with equal values of variables the equation always
produces the same outcome = deterministic process
• in the equation describing the process a random element
can be added
• then the equation can produce different outcome in every
realization – even by same variable values = stochastic
process
• For example the equation: z = 2x + 3y ± 1
Riippumaton satunnaisprosessi
• riippumaton satunnaisprosessi, täydellinen spatiaalinen
satunnaisuus (IRP, CSR), siinä vallitsee
– yhtäsuuren todennäköisyyden ehto
• jokaisella pisteellä on yhtösuuri todennäköisyys
sijaita missä vain=jokaisella sijainnilla on yhtäsuuri
todennäköisyys olla pisteen paikka
– riippumattomuusehto
• pisteen sijoittuminen johonkin sijaintiin on
riippumaton muiden pisteiden sijainnista
Independent random process
• Independent random process (IRP) , complete spatial
randomness (CSR), means
– Condition of equal probability
• Any point has equal probability of being in any
position
– Condition of independence
• Positioning of any point is independent of the
positioning of any other point
Millä todennäköisyydellä ?
• esimerkiksi kahdeksaan yhtäsuureen osaan jaetun
alueen yhdessä osassa on piste A (10 pistettä)
– P(piste A tietyssä osassa) = 1/8
• yhdessä osassa on vain yksi piste A kymmenestä
pisteestä
– P(vain A tietyssä osassa) = 1/8 x 7/8 x 7/8 x 7/8 x 7/8 x
7/8 x 7/8 x 7/8 x 7/8 x 7/8
• Yleinen kaava todennäköisyydestä, jolla k pistettä
kymmenestä on tietyssä osassa kahdeksasta osasta
– P(k pistettä) =(k:n pisteen mahdolliset kombinaatiot) x
(1/8)k x (7/8)10-k
What is the probability?
• for example if we have 10 events in the pattern and the
study region is divided into 8 subareas of equal size
– P(event A is in a specified subarea) = 1/8
• the probability that in one subarea there is exactly one and
only one event A
– P(event A only) =1/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x
7/8 x 7/8 x 7/8
• general formula according to which, k events out of 10 are
in a specified subarea (of 8 areas) (pp. 60…62 in the book)
– P(k events) =(all possible combinations of k events) x
(1/8)k x (7/8)10-k
• tulokseksi tulee binomijakauma (kaava 3.10
kirjassa)
• Poisson jakauma käytännöllisempi laskea ja
approksimoi hyvin binomijakaumaa (kaava 3.13)
• the result is the binomial distribution (formula 3.10
in the book)
• we have specified the independent random process ;
mathematics to predict the frequency distribution;
can be used for testing of the behaviour of
(point)processes
• Poisson distribution is more practical (formula
3.13)
Todellisissa ilmiöissä
• binomijakauma on usein äärimmäisen epärealistinen
• spatiaalinen riippuvuus ilmenee
– ns. ensimmäisen asteen efektinä: keskiarvo vaihtelee
spatiaalisesti
– ns. toisen asteen efektinä: tapahtumat riippuvat
toisistaan spatiaalisesti
• seuraus: ilmiö ei ole stationäärinen
In real phenomena
• binomial distribution is often extremely unrealistic, other
measures
• spatial dependence shows up as
– First order effect: the mean is spatially dependent
– Second order effect: there is interaction between
events
• the phenomenon is not stationary
Stationäärisyys ja isotrooppisuus
• ensimmäisen asteen stationäärisessä prosessissa:
– keskiarvo on vakio
• toisen asteen stationäärisessä prosessissa
– ilmentymien välillä ei ole vuorovaikutusta
• riippumaton satunnaisprosessi on sekä ensimmäisen, että
toisen asteen stationäärinen;
– prosessia hallitsevat säännöt eivät muutu spatiaalisesti
• isotrooppisessa prosessissa ei esiinny suuntautunutta
riippuvuutta
• anisotrooppinen prosessi vaihtelee tietyssä suunnassa
Stationarity and isotropy
• in the first order stationary process
– the mean is constant
• in the second order stationary process
– there is no interaction between events
• an independent random process is both first and second
order stationary;
– the rules that describe the process do not change
spatially
• in an isotropic process there is no directional dependency
• an anisotropic process varies in some direction
IV Spatiaaliset mallit
• ennustamiseen ja skenaarioiden tuottamiseen
• toimintaperiaatteiden vaikutusten analysointiin
• toimintaperiaatteiden luomiseen ja suunnitteluun
• usein spatiaaliset ilmiöt ovat sellaisia, että varsinaisia
kokeita ei voida suorittaa – ainoa tapa tutustua ilmiöön on
laatia malli
IV Spatial models
•
•
•
•
predicting and scenario generation
policy impact analysis
policy generation and design
very often spatial phenomena are such that real tests can
not be organized, the only possibility to test is to make a
model and test it
• do not mix spatial models of phenomena and spatial data
models !!!!!
Malli ...
• ”Malli on yksinkertaistettu tutkimuksen kohteen esitys,
joka on aikaansaatu kuvaamisen, selittämisen,
ennustamisen tai suunnittelun tarpeisiin. Spatiaalinen malli
on tutkimuskohteen sijainti/ominaisuus malli.
Spatiotemporaalinen malli on tutkimuksen kohteen
sijainti/ominaisuus/aika malli.” (Fisher et al., 1996)
Model ...
• ”A model is a simplified presentation of the object of
study, made for the purposes of description, explanation,
forecasting or planning. Spatial model is a spatial/attribute
model of the object. Spatio-temporal model is a
spatial/attribute/temporal model of the object.” (Fisher et
al., 1996)
• todellinen maailma edellyttää todellisessa maailmassa
tehtäviä johtopäätöksiä
• niitä voidaan auttaa tutkimalla todellisuuden ilmiötä,
tunnistamalla sen olennaiset tekijät ja valittujen tekijöiden
väliset suhteet > malli
• malli formuloidaan matemaattiseksi malliksi, joka voidaan
ratkaista
• mallin rajoitukset ja yksinkertaistukset otetaan huomioon
johtopäätöksiä tehtäessä
• in the reality we need conclusions made in the reality
• we can support them by analysing the real phenomena, by
identifying the essential factors and relationships between
selected objects > model
• a mathematical model is formulated, a mathematical model
can be solved
• the simplifications and restrictions of the model are taken
into account when solving the model
Spatiaalisten mallien
käyttöalueita
• mallinnetaan fyysisiä/ympäristöilmiöitä sekä
sosiaalisia ja taloudellisia prosesseja
–
–
–
–
–
–
–
–
–
sää, ilmasto
maaperä, korkeus
veden ekosysteemi
eroosio, pohjaveden liike
alueellinen talouskehitys
muuttoliike
palvelujen ja tuotantolaitosten sijoittelu
kuljetus
kaupungin maankäyttö
Use of spatial models
• physical or environmental phenomena,
social and economical processes
–
–
–
–
–
–
–
–
–
weather, climate
soil, elevation
water ecosystems
erosion
local economical development
migration
location of services and industrial plants
transportation
urban land use
DEM-pohjainen tulvamalli: jos merenpinta
nousee 5 m Helsingin alueella
Tulvamallissa käytetään
korkeusmallia.
Maanjäristyksen seurausmalli
Case: Maanjäristys Rhodoksella/UHHA
Näitä malleja kehittävät seismologit.
Esimerkki on yksinkertaistetusta
mallista.
Kaasuvuodon leviämismalli
Case: FinnChemicals, Kuusankoski/UHHA
Tämän mallin on
kehittänyt Ilmatieteen
laitos. Esimerkkikuva
on yksinkertaistetusta
mallista.
sivu 109
Väestömalli yhdessä kaasuvuotoa kuvaavan mallin
kanssa
Vaarallinen alue
on kuvattu ympyrällä, kaasuvuoto
sinisellä ja väestö
vihreällä.
Korpi,J., ZhangZhe,
2008
Vaarallinen alue pommi-iskussa; yksinkertaistetulla
paineaaltomallilla.
Paineaaltomalli: Paineen leviäminen pommi-iskussa +
vahingoittuneiden ihmisen määrä
Hyvin
yksinkertainen malli
paineaallon
vaikutuksesta
ja
vahingoittuneiden ihmisten
määrästä.
Spatiaaliset mallit ovat erilaisia
• sovellusalueeltaan, mittakaavaltaan
• mallityypiltään
– deterministiset - perustuvat kaavoihin, jotka tuottavat
aina samoilla inputeilla samat outputit
– stokastiset - perustuvat ilmiöiden satunnaisuuteen
– systeemimallit kuvaavat osaa reaalimaailmaa, kohteet ja
niiden väliset suhteet
– optimointimallit ratkaisevat tavoitefunktion
– simulointimallit jäljittelevät todellisuutta luomalla
realisaatioita annettujen sääntöjen mukaan
– deskriptiiviset spatio-temporaaliset mallit kuvaavat
ilmiön aika-paikka-vaihtelua
Spatial models are different
• application field, scale
• type of the model
– determininistic – based on the formula that produces
with given inputs always equal outputs
– stochastic – based on randomness
– system models describe a given part of reality with
relationships
– optimization models, solve the goal function
– simulation models produce realizations according to
given rules
– descriptive spatio-temporal models
Esimerkkejä spatiaalisista malleista
• ilmastomalli, merimalli
– 4d vokselimalleja
– hallintaan fysikaalisia/biologisia ilmiöitä
– lähtö- ja tukiaineistona käytetään GIS-aineistoja
– mallien tuloksia visualisoidaan karttoina
• metsäpalojen simulointimallit
– GIS –lähtöaineiston pohjalla
• täsmäviljelyn operatiiviset mallit
Examples of spatial models
• climate model, sea model
• 4d voxel models
• physical/biological phenomena
• GIS data as source and support data
• models are visualized as maps
• simulation models of forest fires
• GIS –source data
• operative models for agriculture
• korkeusmalli on useimpien fyysisen ympäristön analyysien
pohjana
– hydrologiset sovellukset, valumamallit
– maisema-analyysi ja rakentaminen
– sotilassovellukset, simulaattorit
– radioverkon suunnittelu
• yhteiskunnallis-taloudelliset mallit
– väestö, tuotanto
• elevation model is used in most of the analysis for physical
reality
– hydrological applications, drainage models
– building and landscape analysis
– military applications, simulators
– radio network planning
• socio-econimical models
– population, production
Paikkatietomallin toteutus
• GIS-toteutuksessa kohteet ja pinnat voidaan toteuttaa joko
vektorimallilla tai rasterimallilla
• periaatteessa samoja analyysejä voidaan tehdä kummallakin
(vrt. reittioptimoinnit verkossa ja kustannuspinnalla)
• valinta riippuu siitä, mikä on luontevin tapa mallintaa
kohdesysteemiä
• esim. 4d-vokselimallit ilmaston ja meren mallinnukseen
Implementing the GI
model
• objects and fields can be implemented as rasters or vector
models
• in principle the same analysis can be made for raster and
vector models
• the selection of the implemntation is based on the decision
about the most natural presemtation
• for example 4-d voxel models for climate models
Ongelma ohjaa datan mallinnusta ja
datamalli ympäristön valintaa
• ongelma ohjaa tietomallin valintaa, tietomalli ohjaa
ohjelmiston/algoritmin valintaa
– merimalli ja ilmastomalli: vokselimalli, 3d/4d-hila
– näkyvyys- ja kuuluvuusanalyysit, valuma-analyysit, 2,5
d-hila tai TIN-verkko
– kuljetus- ja sijoitteluongelmat: verkkomalli tai
pikselimalli, 2d-hila
– väestöön liittyvät analyysit, 2d aluejako
– epidemiologinen analyysi: pisteaineisto
Problem > data model>
implementation environment
• the data model is derived from the problem and the
selection of the software/algorithm is derived from the data
model
– sea model and climate model: voxel model, 3d/4d-grid
– visibility analyses, drainage analyses, 2,5 d-raster or
TIN-network
– transportation and location problems: graph model or
pixel model, 2d-raster
– demographic analyses, 2d polygon maps
– epidemiological analyses: point sets
Yhteenvetoa
• pistejoukot ja jatkumot helpoimpia mieltää ja mallintaa
prosessseina
• spatiaalisen vaihtelun oikea mallintaminen ja mittaaminen
on keskeinen ongelma
• todellisuuden abstraktiotaso (mittakaava) vaikuttaa
olennaisesti dataan ja tuloksiin
Some conclusions
• point sets and fields are easy to understand and model as
processes
• modeling and measuring spatial dependency correctly is
one of the major problems
• the level of abstraction of reality has a big effect to the data
and results
Kirjallisuutta
• Sullivan,D., Unwin,D., Geographic information Analysis,
1. painos, luvut 1,2 ja 3, (7),8
– Malczewski,J., GIS and Multicriteria Decision Analysis,
1999,luvut 1 ja 2
– Fisher,M., Scholten,H., Unwin,D., Spatial Analytical
Perspectives on GIS, 1996. luku 1 ja luku2
– Bailey,T., Gatrell,A., Interactive Spatial Data Analysis,1995.
Introduction.
– Burrough,P., McDonnell,R., Principles of Geographical
Information Systems, 1998.
– Tomlin,D., GIS and Cartographic Modeling.
– Longley,P., Goodchild,M.,Maguire,D., Rhind,D.,GIS, Vol1,
sectio 1c, 1999.
– Openshaw,P., Abrahart, R., GeoComputation, 2000.
Literature
• Sullivan,D., Unwin,D., Geographic information Analysis,
1st edition, Chapters 1,2,3, (7), 8
– Malczewski,J., GIS and Multicriteria Decision Analysis, 1999,
Chapters1 ja 2
– Fisher,M., Scholten,H., Unwin,D., Spatial Analytical
Perspectives on GIS, 1996. Ch 1 ja Ch 2
– Bailey,T., Gatrell,A., Interactive Spatial Data Analysis,1995.
Introduction
– Burrough,P., McDonnell,R., Principles of Geographical
Information Systems, 1998.
– Tomlin,D., GIS and Cartographic Modeling.
– Longley,P., Goodchild,M.,Maguire,D., Rhind,D.,GIS, Vol1,
sectio 1c, 1999.
– Openshaw,P., Abrahart, R., GeoComputation, 2000.