Johdanto paikkatietoanalyysiin Kirsi Virrantaus Maa-123.3510 GIS Analysis & Modelling (5 cr) Introduction to Geographic Information Analysis Kirsi Virrantaus Maa-123.3510 GIS Analysis & Modelling (5 cr) 0. Esimerkki • Geoinformatiikan tutkimusryhmässä kehitetty GIS-analyysisovellus (J-Nikander, väitöskirja) • aiheena maaston kulkukelpoisuuden analysointi maastotietojen perusteella • maaperä, korkeusmalli ja kasvillisuuden määrä • menetelmä perustuu klusterointiin (oletetaan, että jos alueilla vallitsee samanlaiset maasto-olosuhteet niin ne ovat kulkukelpoisuudeltaankin samanlaisia) sekä visualisointiin ja interaktioon 0. Example • an analysis method developed in the Research Group of Geoinformatics (J.Nikander, doctoral thesis) • topic: cross-country mobility analysis based on terrain data • soil map, elevation model, vegetation data • method is based on clustering (we assume that if two regions have equal terrain they also are equal in the mobility plus visualization and interaction Visuaaliset menetelmät analyysityökaluna • visualisointi on usein helppo ja nopea mutta subjektiivinen työkalu • on tilanteita, joissa laskennallinen analyysi on liian työlästä/turhaa • voidaan hyödyntää GIS-järjestelmän visuaalisuutta • käyttäjän subjektiivisuus voi olla hallinnassa • eksploratiivinen analyysi: ohjelmisto suorittaa automaattisia laskentoja ja visualisoi, käyttäjä tekee johtopäätöksiä ja valitsee toimintoja Visual methods in spatial analysis • visualization is often easy and quick but subjective tool • there are situations where computational analysis is not necessary/efficient • the visuality of GIS can be utilized • the subjectivity of the user can be under control • explorative analysis: the software performs automatic analyses and visualize the results, the user the makes decisions and select new functions to be performed Esimerkin tarkastelua • edellisessä esimerkissä käytettiin – monimuuttujadatan visualisointia PCPmenetelmällä (parallel coordinate plot), – karttaa – vuorovaikutusta (käyttäjän valintoja) – laskentaa (klusterointi) • tyypillinen spatiaalianalyysin tapaus • visualisointi, laskenta ja käyttäjän päätökset muodostavat analyysiprosessin In the previous example • we used – multivariate visualization method (PCP, parallell coordinate plot) – map – user interaction (decisions) – computation (clustering) • this is a typical example of spatial analysis process • visualization, computing and users decisions make an analysis process Tieteellinen visualisointi – eksploratiivnen data-analyysi, visuaalinen analyysi • tieteellinen visualisointi: graafinen datan ja informaation tutkiminen tavoitteena ymmärryksen ja oivalluksen aikaansaaminen • eksploratiivisessa data-analyysissä kartat eivät ole tulosten esittämistä vaan analyysin välineitä • geoinformatiikassa käytetään “visuaalisen analyysin” termiä tässä yhteydessä Scientific visualization – explorative analysis, visual analytics • scientific visualization : exploring data and information graphically as a means of gaining understanding and insight • in explorative data analysis maps are tools for analysis not for presentation of results • in geoinformatics the term “visual analytics” is used (inludes also computation) First lecture structure • 1. Motivation • 2. Intro to the taxonomy of methods and the text book (O´Sullivan & Unwin, Geographic Information Analysis, 2003) – Intro to the text book – – – – Spatial manipulations Spatial data analysis Spatial statistical analysis Spatial models 1. Motivation: Why Spatial analysis? • in order to understand and explain the events and phenomena in the world • we want to explain the reasons/causes and predict the future • we need to study the phenomenon itself and the environment in which the events take place • for that we need verified and validated models that are based on reliable data and scientific methods Why Spatial is special? • each object/event in our world happens – in some location (x,y,z) and – at some time (t) • => in a spatio-temporal space • in order to model the objects in this space we need spatial and spatio-temporal relationships • the elementary objects between which the spatial relationships are defined are: – points, lines and polygons(areas) • the core difference between spatial and non-spatial objects/events is realized in these spatial relationships Space-time cube Hägerstrand, 1970 Nowadays implemented in analysis softwares http://www.r-bloggers.com/r-interactive-3d-webgl-plot-of-time-space-cube-with-rgl/ Example on spatio-temporal data in space-time cube. Trajectories of ships in space-time cube (Demsar&Virrantaus,201 Some spatial relationships • distance between two locations, the length of the connecting line; d • direction of a line connecting two locations; α • proximity defined by for example the circle around an object defined by the radius or another polygonal shape around the object that can be exactly defined for example by a function or by geometry • distance, direction and proximity are metric relationships • adjacency defined by for example the common boundary line between two polygons or end point of two lines, can also be defined in higher orders • connectivity (see also contiguity) is a more general concept having various definitions in various field of science; in geoinformatics connectivity is very similar concept to adjacency and even proximity • adjacency and connectivity are topological relationhisps, (they represent relationships that remain even when the spatial reference is distorted (rubber sheet effect)) Spatiaaliset ja topologiset relaatiot • ”Spatiaaliset relaatiot kuvaavat millaisessa sijainnillisessa suhteessa spatiaalinen kohde on toisiin spatiaalisiin kohteisiin” • ”Topologia on matematiikan osa-alue, jota käytetään vektorimaisten geometristen kohteiden eheyden validointiin, verkko-operaatioiden tai polygoniverkkojen prosessoinnin suorittamiseen” • ”Topologia on ominaisuus, joka säilyy vaikka spatiaalista referenssiä venytetään tai vääristetään” Spatial relationships and analysis • Spatial relationships are the core concepts in spatial data modeling but also in spatial analysis • Simple analyses – can be made just based on these relationships and geometry; • quite often the data has been organized into a topological data structure (DIME;DCEL) – in order to support computation of simple manipulation operations: • map overlay, point-in-polygon, nearest neighbour,shortest path …continues • In spatial data analysis, spatio-statistical analysis and modelling – more advanced methods are used – spatial relationships are still in the core role • For example adjacency relationship is used when spatial autocorrelation is analysed – It is often used in the form of W (weight/adjacency matrix) Spatial phenomena are special • real world is not homogeneous platform for phenomena – physical structures, barriers, obstacles; terrain, vegetation, waters – human behaviour; people tend to group in cities, villages etc. • In Geography and spatial analysis this is modeled by the concept of spatial autocorrelation – ” things close to each others tend to be more similar than things further from each others” (1st law of Geography, Tobler´s law) • spatial autocorrelation is modeled by the concept of interaction; interaction is measured by distance and the objects of interest are identified by adjacency relationship Small exercise • Think what is the difference between – Distance and – Adjacency • Why we need the adjacency relationship? Why distance is not enough? Specialities of spatiality for analysis • Spatial relationhips – must be somehow implemented in the analysis methods – by data structure or computation • Spatial autocorrelation – must be taken into account in the analysis methods and processes – the assumption of ”complete spatial randomness” can not straightforwardly be used When analysing graphs (networks) the topological data structure is essential (Tiet – Digiroad) ZhangZhe, 2010 • when modeling graphs graph topology (= connectivity between lines) is of major interest • if the graph structure is not consistent (=if the topology has mot been correctly modeled) graph analyses (like shortest path) can not be computed • quality element: consistency Small exercise • What happens in graph analyses if the road network topology is not correct ? • How the topology can be automatically created in a non-topological data set ? The Quarternary deposits map (Maalajikartta) is a good example of spatial autocorrelation Sunila,R., 2009 Small exercise • What kind of topological relationship is of core importance in the previous data set? – Spatial elements? – Relationship in the model ? 2. Luennon sisältö – keskeisiä käsitteitä • Spatiaalisen datan manipulointi • Spatiaalinen data-analyysi • Spatiaalinen tilastollinen analyysi • Spatiaalinen mallinnus • Spatiaaaliset prosessit ja niiden kuvaukset • Riippumaton stokastinen prosessi • Geometria, ominaisuudet, topologia • Voronoi-diagrammi • Pinnan mitat • Spatiaalinen autokorrelaatio • Variogrammipilvi • Ensimmäisen ja toisen asteen efektit • Sationäärisyys, isotrooppisuus 2. Contents – core concepts • Manipulation of spatial data (by using GIS) • Spatial data analysis (explorative, descriptive) • Spatial statistical analysis (applied statistical method) • Spatial modelling (predicts spatial outcomes) • • • • • • • • • Spatial processes and patterns Independent stochastic process Geometry, attributes, topology Voronoi-diagrams Measures of surfaces Spatial autocorrelation Variogram cloud First and second order effects Stationarity, isotropy Analyysit geoinformaatiotieteeteessä • GIS-historian lähtökohta: kvantitatiivinen maantiede, analyyttinen kartografia – pisteiden, viivojen ja alueiden geometrinen, tilastomatemaattinen ja verkkoteoriaan pohjautuva analyysi • GIS järjestelmät: laajat paikkatieto-aineistot • GIS-ohjelmistot: visualisointityökalut ja spatiaalisen data ns. manipulointityökalut – eivät sisällä spatiaalisen analyysin ja mallinnuksen kehittyneitä työkaluja – tämä on nyt muuttumassa, kehittyneempiä menetelmiä tulee ohjelmistoihin Spatial analysis in GIScience • spatial analysis has a history longer than GIS • SA is actually the starting point of GIS: quantitative geography, analytical cartography – analysis of points, lines and areas, based on geometry, statistics and graph theory • GIS systems: data bases • GIS software: visualization and spatial data manipulation tools – GIS analysis toolboxes in the commercial software do not inlcude advanced spatial analysis and modeling possibilities – this is now chaging, more methods are sooffered by softwares • ”GIS is data rich but theory poor” (Openshaw) – ei enää pidä täysin paikkaansa • GIS –ohjelmistojen toiminnallisuudet: – aritmetiikkaan ja geometriaan perustuvia laskentoja – puskuroinnit, overlayt, lyhimmät reitit, näkyvyydet • analyysissä tarvitaan data-analyysiä, tilastollista analyysiä, matemaattista mallinnusta sekä datan ja tulosten epävarmuuden tarkastelua, koko päätöksentekoprosessin analysointia • ”GIS is data rich but theory poor” (Openshaw) – no more true • more advanced methods are required than the functionalities in GIS software: – measurements based on arithmetics and geometry – buffers, overlays, shortest paths, visibility • advanced data analysis, statistical analysis and mathematical modeling • analysis of the uncertainlty of source data as well as the reliability of the results • analysis of the spatial decision making process • In our curriculum: this course + • Spatial data Mining –course, Uncertainty in GI –course, Visual analytics -course Analyysimenetelmistä • Menetelmä riippuu käytetystä tietomallista • Menetelmään vaikuttaa – Geometrian mallinnus; objekti, kenttä – Topologian mallinnus; millaisia relaatioita mallissa on – Ominaisuuksien määrä ja tyyppi • Oppikirjan menetelmäluokittelu About the analysis methods • Selection of the analysis method to be used is limited by – The data model used; object or field model – The topological relations in the model – The amount and type of attributes • Classification of the analysis methods into four classes in the Text Book Analyysimenetelmä riippuu tietomallista • paikkatiedot mallinnetaan objekteina tai kenttinä • objektit, kohteet (objects) – pistemäisiä, viivamaisia, aluemaisia ja näistä koostuvia diskreettejä kokonaisuuksia • kentät, jatkumot (fields) – jatkuvia ilmiöitä kuvaavaa dataa – jatkuva malli • esim. korkeusmalli – luokkamuuttujadata • esim. maalajikartta Analysis method depends on the spatial data model • geographical information is modeled as • objects – points, lines, polygons and discrete combinations of these • fields – data on continuous phenomena – continuous model • for example elevation model – categorical variables • for example soil map Spatiaalisen datan erityispiirteet • • • • geometria ominaisuudet topologia kohdemaisen kuvaamisen ongelmia: – samaa kohdetta joudutaan kuvaamaan eri tavoin eri mittakaavassa ja eri sovelluksia varten – kaikki kohteet eivät ole tarkkarajaisia: sumea mallinnus What is special in spatial data • • • • geometry attributes topology / relationships problems in object models: – multiple representation problem for varying scales and various applications – all objects are not crisp; fuzzy models Geometria, topologia, ominaisuudet • etäisyys, suunta • viereisyys, yhdistävyys • erityisiä pintojen ominaisuuksien mittoja kuten kaltevuus, aspekti; analyysejä kuten näkemäalue, LOS = ”line of sight”, näkemäviiva • spatiaalisia ominaisuuksia voidaan kuvata mm. viereisyysmatriisilla, Thiessen/Voronoi polygoneilla – erityiset tietorakenteet näihin • ominaisuuksien mittaamiseen nominaali, järjestys, välimatka ja suhde -asteikot Geometry, topology, attributes • distance, direction • adjacency, connectivity • measures of surfaces: slope,aspect; analyses like viewshed and LOS • spatial characteristics can be described for example by matrices or Voronoi/Thiessen diagrams – spatial data structures • measuring attributes by nominal, ordinal, incremental and ratio scales Attribute measures • Nominal (categorical) – inclusive and mutually exclusive categories • Ordinal (categorical) – can be ranked according to some criterion; order but no difference • Interval – differences/distance between categories can be defined by fixed units • Ratio – ratio scale has an absolute zero Ominaisuustiedon mittaaminen • Nominaaliasteikko – vain laatu • Järjestysasteikko – laatu ja järjestys • Välimatka-asteikko – järjestystä voidaan mitata vakioyksiköllä – nollapiste mielivaltaisesti valittu • Suhdeasteikko – absoluuttinen nollapiste Oppikirjassa jaotellaan menetelmät: • 1. spatiaalisen datan manipulointi – kaupallisten tuotteiden toiminnallisuudet • 2. spatiaalinen data-analyysi – eksploratiivistä ja kuvailevaa • 3. spatiaalinen tilastollinen analyysi – todellisen datan testaaminen tilastollisten mallien avulla • 3. spatiaalinen mallinnus – spatiaalisten ilmiöiden käyttäytymisen ennustaminen The classification of methods used in our textbook: • I spatial data manipulation – (simple) functionalities in GIS –analysis toolboxes • II spatial data-analysis – explorative and descriptive • III spatial statistical analysis – comparing the data with statistical models • IV spatial modeling – predicting the behaviour or spatial phenomena by models I Paikkatiedon ”manipulointi” • vektorikohteiden (piste, viiva, alue) geometriaan tukeutuvat laskennat – etäisyydet, puskurit, piste alueessa jne. • verkkopohjaiset yksinkertaiset ongelmat • rasterimuotoinen analyysi – map algebra (Tomlin) – vrt. filtterit - kuvankäsittelyä • yksinkertaista tilastollista ja geostatistista käsittelyä – joitain funktioita I Manipulation of GI • measurements and calculations based on vector objects (point, line, polygon) – distances, buffering, point-in-polygon, overlays etc. • basic graph problems • raster/grid analysis – map algebra (Tomlin) – image processing • only simple statistics and geostatistics – some functions – mean Esimerkkejä manipulointitoiminnallisuuksista • verkoille: linkeille, solmuille – janojen leikkaus, piste viivalla, vyöhykkeet, yleistys – segmentointi, geometriasta topologiaksi • rasterille: pikselille, naapuruusalueelle, koko tasolle, aluejaolle (local, focal, zonal) – uudelleenluokittelu, uudelleenkoodaus, vaihtelu, vallitsevuus, interpolointi Examples of basic manipulation functions • graphs: links, nodes – intersections, point-in-line, buffers, generalization – segmenting, from geometry to topology • rasters: pixel, neighbourhood, entire layer, zoning (local, focal, zonal) – reclassification, recoding, interpolation ...jatkuu • Alueille, aluejaoille – “point-in-polygon”, piste aluejaossa, keskipiste/referenssipiste, janan ja alueen leikkaus, alueiden unioni ja leikkaus, alueen ikkunointi, vyöhykkeet, “polygon overlay”, pinta-ala, alueesta pisteeksi, tietorakennemuunnokset • Pisteille, pistejoukoille – lähin piste, lähimmät pisteparit ...continues • polygons, polygon networks – “point-in-polygon”, point-in-polygonmap, center /reference point, line-in-polygon, union and intersection of polygons, windowing a polygon, buffers, “polygon overlay”, area, from polygon to point, data structure conversions • points, point sets – nearest point, closest point pairs Esimerkkejä ohjelmistojen valmiista analyysisovelluksista • Verkolle, esim. tieverkko – lyhin reitti, kauppamatkustajan ongelma, sijoitteluongelma, virittävä puu • Rasterille, esim. korkeusmalli – “proximal areas”, kustannuspinta ja kulkureitin optimointi, näkyvyysalueet, valuma • Alueet ja aluejaot, esim. tilastoaluejako – “map overlay”, aluejakojen luominen Examples of ready made analysis applications in GIS-software • graphs, for example road networks – shortest path, traveling salesman, location problems, spanning tree • rasters, for example elevation model – “proximal areas”, cost surface and path optimizing, visibility areas, drainage • polygons and polygon networks, for example statistical map – “map overlay”, creating of polygon maps • pisteille, pistejoukoille, esim. korkeuspisteet, maaperätutkimuspisteet – pistejoukosta Voronoi -polygoniksi, pistejoukosta kolmioverkoksi, pistejoukosta matriisiksi • points, point sets, for example height points, soil investigation points – from a point set to a Voronoi polygon map, from a point set to a TIN, from a point set to a matrix GIS -ohjelmistot • ohjelmistot tarjoavat toolboxin valmiita funktioita ja pieniä ongelmanratkaisusovelluksia • kun ohjelmistot tarjoavat valmiita toiminnallisuuksia on suuri vaara, että ryhdytään käyttämään valmiita toiminnallisuuksia analysoimatta ongelmaa • saatetaan ratkaista hienosti, mutta väärä ongelma • lisäksi valmisohjelmistojen toiminnallisuudet eivät ole aina dokumentoituja, algoritmejä ei tunneta täsmällisesti, algoritmi voi olla huono Problems with using the existing commercial GIS sotware • they offer a nice toolbox of ready-made functionalities and problem solving applications • it is very temptating just to apply the tools without profound analysis of the problem • you can get a nice solution to a wrong problem ! • commercial software functions are not always well documented, the algorithms are not known; the algorithm can be just bad II Spatiaalinen data-analyysi • spatiaalinen data-analyysi – kuvataan prosesseja ja ilmiöiden esiintymisen muotoja/kuvioita tilastollisin tunnusluvuin, ei hypoteesia, ei testausta • eksploratiivinen analyysi – tilastolliset menetelmät, visualisointi ja interaktio, visuaalinen analyysi (edellinen esimerkki onnettomuuksista) – kartat analyysin työkaluina, ei vain tulosten esittäjinä II Spatial data-analysis • spatial data analysis – describing spatial data by using statistical measures, no hypothesis, no testing • explorative data analysis (EDA) – statistical methods, visualization and interaction, visual analysis (the given example on incidents) – maps as analysis tools and not only for presentation of the results Esimerkkejä spatiaalisista dataanalyysimenetelmistä • Kernel –menetelmän käyttö klusterointiin, hotspottien tunnistamiseen (cold spot) – menetelmä perustuu matemaattisen funktion käyttöön – menetelmän oikea käyttö pohjautuu käyttäjän asiantuntemukseen ja interaktioon • bandwidth – tulosten tulkinta visuaalisesti • Moranin indeksi kertoo onko autokorrelaatiota • variogrammipilven käyttö spatiaalisen autokorrrelaation toteamiseen (kirjan esimerkki) Examples of spatial data-analysis • using of Kernel –density mapping for identifying clusters – this method uses some mathematics for the model – however the correct use is based on the users experience and interaction • bandwidth – the results are interpreted visually • Moran´s I for testing autocorrelation • using variogram clouds for identifying spatial autocorrelation (example in the book) Hot spot, klusteri • Hot spot – Hot spot on alue, jossa esiintyy keskiarvoa enemmän tutkittavaa asiaa/kohdetta – Vastakohta cold spot • Klusteri – Klusteroinnissa pyritään kohteet jakamaan mahdollisimman samankaltaisiin ryhmiin ominaisuuksiensa perusteella Hot spot, cluster • Hot spot / cold spot – In hot spot there can be found more than average amount of the objects/events of interest – Cold spot is the opposite for hot spot • Cluster – In clustering the objects are divided into groups that are as similar than possible according to their attribite values Kernel-menetelmän käyttö (Krisp) • Kernel menetelmä • yksittäisistä havainnoista • tiheyspinnaksi yksittäiset havainnot tiheyspinta Kernel-säteen valinta (Krisp) • Mitä suurempi säde sitä yleistetympi esitys • Pieni säde näyttää enemmän yksityiskohtia • Kernel-mentelmä on yksinkertainen ja helppo käyttää, mutta oikea käyttö vaatii menetelmän käyttäytymisen ymmärtämistä Spatiaalinen autokorrelaatio • toisiaan lähellä olevat kohteet ovat samanlaisempia kuin kaukana olevat – spatiaalinen data ei ole satunnaisesti jakautunutta – positiivinen, negatiivinen tai nollaautokorrelaatio • autokorrelaation mittoja – Moran´s I, variogrammipilvi Spatial autocorrelation • data near each others are more likely to be similar that data remote each others – nonrandom distribution of spatial data – positive, negative or 0-autocorrelation • Measures for autocorrelation – Moran´s I – Variogram cloud Variogrammipilvi • ilmentää ominaisuuden ja sijainnin välistä suhdetta • esim. kuvat 2.6 ja 2.7 kirjassa – maaston harjumainen rakenne korkeuskäyrinä (kuva 2.6) ja korkeusdata sijaintiin suhteutettuna variogrammikuvana (2.7) – kaikille mahdollisille pistepareille lasketaan korkeustiedon eron neliöjuuri (y) ja sijoitetaan arvo pisteiden etäisyyden mukaan (x) – variogrammipilvi ilmaisee autokorrelaation Variogram cloud • reflects the relationships between attribute values and spatial location of the entities in the data set • examples in the figures 2.6 and 2.7 in the text book – terrain as a contour map (2.6) – same data organized as a variogram cloud: for all possible point pairs the square root of the difference in their heights is plotted against the distance they are apart – interpretation of the variogram cloud tells about the autocorrelation in the data set O´Sullivan &Unwin, 2003) O´Sullivan &Unwin, 200 O´Sullivan &Unwin, 200 … • analysoidaan itä-länsi suuntaa ja pohjois-etelä- suuntaa – esimerkissä nähdään, että pohjois-eteläsuunnassa olevien pisteparien korkeuserot ovat suurempia kuin itä-länsisuunnassa olevien pisteparien; vastaa korkeuskäyräesitystä – tätä ilmiötä nimitetään anisotropiaksi; datan spatiaalisessa vaihtelussa on suuntaan liittyvä piirre … • analysis of N-S and W-E oriented pairs – in the Fig 2.8 we can see that the differences between N-S oriented pairs are greater that between E-W oriented pairs; matches with the contour maps – this phenomenon is called as anisotropy = there is a directional effect in the spatial variation of the data III (luku3) Spatiaalitilastollisessa analyysissä ilmiöt mallinnetaan prosesseina • aineistoja analysoidaan suhteessa tilastollisiin malleihin – haetaan tyypillistä ja ei-tyypillistä käyttäytymistä • aineisto (kartta) on prosessin realisaatio • esim.pistekartta on tietyn pisteprosessin realisaatio – esimerkki: ”Suomen asukkaat” voidaan mallintaa pisteprosessina ja pistekartta, joka kuvaa pisteenä jokaisen asukkaan on tämän prosessin realisaatio • spatiaalisia prosesseja voidaan kuvata matemaattisilla malleilla – deterministisillä tai stokastisilla III In spatiostatistical analysis phenomena as processes (Ch3) • spatial data are analysed in order to find typical or unexpected behaviour • (data)patterns (maps) are realizations of processes • for example dot map is a realization of a point process – “Inhabitants of Finland” can be modeled as a point process and the dot map showing each citizen is the realization of that process • spatial processes can be modeled by mathematical models – deterministic or stochastic Kuvio kartalla, hypoteesi ja sen testaus • havaittu data, karttaesitys, on eräs mahdollisista kuvioista, jotka ilmiötä hypoteettisesti kuvaava prosessi saattaa tuottaa • spatiaalinen prosessi on kuvaus siitä, kuinka spatiaaliset kuviot (pattern), joita esitetään kartoilla, ovat saattaneet syntyä Pattern on a map, hypothesis and testing • an observed map pattern is one of the possible patterns that might have been generated by the hypothesised process • a spatial process is a description of how a spatial patterns might be generated GIS-JÄRJESTELMÄÄN TALLENNETUN DATA N VISUALISOITEJA DESKRIPTIIVISET JA EKSPLORATIIVISET MENETELMÄT NOSTAVAT KYSYMYKSIÄ HYPOTEESIEN TILASTOLLINEN TESTAUS TEORIOITA JA MALLEJA DATA STORED VISUALIZED IN A GIS DESCRIPTIVE AND EXPLORATIVE METHODS RAISE QUESTIONS HYPOTHESISAND STATISTICAL TESTING THEORIES AND MODELS Deterministinen ja stokastinen prosessi • esimerkiksi yhtälö: z = 2x + 3y • yhtälö saa aina samoilla muuttujien lähtöarvoilla aina saman tuloksen = determnistinen prosessi • kun yhtälöön lisätään satunnainen komponentti, voidaan saada erilaisia tuloksia eri realisaatioissa, samoilla lähtöarvoilla = stokastinen prosessi • esimerkiksi: z = 2x + 3y ± 1 Deterministic and stochastic process • For example the equation: z = 2x + 3y • with equal values of variables the equation always produces the same outcome = deterministic process • in the equation describing the process a random element can be added • then the equation can produce different outcome in every realization – even by same variable values = stochastic process • For example the equation: z = 2x + 3y ± 1 Riippumaton satunnaisprosessi • riippumaton satunnaisprosessi, täydellinen spatiaalinen satunnaisuus (IRP, CSR), siinä vallitsee – yhtäsuuren todennäköisyyden ehto • jokaisella pisteellä on yhtösuuri todennäköisyys sijaita missä vain=jokaisella sijainnilla on yhtäsuuri todennäköisyys olla pisteen paikka – riippumattomuusehto • pisteen sijoittuminen johonkin sijaintiin on riippumaton muiden pisteiden sijainnista Independent random process • Independent random process (IRP) , complete spatial randomness (CSR), means – Condition of equal probability • Any point has equal probability of being in any position – Condition of independence • Positioning of any point is independent of the positioning of any other point Millä todennäköisyydellä ? • esimerkiksi kahdeksaan yhtäsuureen osaan jaetun alueen yhdessä osassa on piste A (10 pistettä) – P(piste A tietyssä osassa) = 1/8 • yhdessä osassa on vain yksi piste A kymmenestä pisteestä – P(vain A tietyssä osassa) = 1/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 • Yleinen kaava todennäköisyydestä, jolla k pistettä kymmenestä on tietyssä osassa kahdeksasta osasta – P(k pistettä) =(k:n pisteen mahdolliset kombinaatiot) x (1/8)k x (7/8)10-k What is the probability? • for example if we have 10 events in the pattern and the study region is divided into 8 subareas of equal size – P(event A is in a specified subarea) = 1/8 • the probability that in one subarea there is exactly one and only one event A – P(event A only) =1/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 x 7/8 • general formula according to which, k events out of 10 are in a specified subarea (of 8 areas) (pp. 60…62 in the book) – P(k events) =(all possible combinations of k events) x (1/8)k x (7/8)10-k • tulokseksi tulee binomijakauma (kaava 3.10 kirjassa) • Poisson jakauma käytännöllisempi laskea ja approksimoi hyvin binomijakaumaa (kaava 3.13) • the result is the binomial distribution (formula 3.10 in the book) • we have specified the independent random process ; mathematics to predict the frequency distribution; can be used for testing of the behaviour of (point)processes • Poisson distribution is more practical (formula 3.13) Todellisissa ilmiöissä • binomijakauma on usein äärimmäisen epärealistinen • spatiaalinen riippuvuus ilmenee – ns. ensimmäisen asteen efektinä: keskiarvo vaihtelee spatiaalisesti – ns. toisen asteen efektinä: tapahtumat riippuvat toisistaan spatiaalisesti • seuraus: ilmiö ei ole stationäärinen In real phenomena • binomial distribution is often extremely unrealistic, other measures • spatial dependence shows up as – First order effect: the mean is spatially dependent – Second order effect: there is interaction between events • the phenomenon is not stationary Stationäärisyys ja isotrooppisuus • ensimmäisen asteen stationäärisessä prosessissa: – keskiarvo on vakio • toisen asteen stationäärisessä prosessissa – ilmentymien välillä ei ole vuorovaikutusta • riippumaton satunnaisprosessi on sekä ensimmäisen, että toisen asteen stationäärinen; – prosessia hallitsevat säännöt eivät muutu spatiaalisesti • isotrooppisessa prosessissa ei esiinny suuntautunutta riippuvuutta • anisotrooppinen prosessi vaihtelee tietyssä suunnassa Stationarity and isotropy • in the first order stationary process – the mean is constant • in the second order stationary process – there is no interaction between events • an independent random process is both first and second order stationary; – the rules that describe the process do not change spatially • in an isotropic process there is no directional dependency • an anisotropic process varies in some direction IV Spatiaaliset mallit • ennustamiseen ja skenaarioiden tuottamiseen • toimintaperiaatteiden vaikutusten analysointiin • toimintaperiaatteiden luomiseen ja suunnitteluun • usein spatiaaliset ilmiöt ovat sellaisia, että varsinaisia kokeita ei voida suorittaa – ainoa tapa tutustua ilmiöön on laatia malli IV Spatial models • • • • predicting and scenario generation policy impact analysis policy generation and design very often spatial phenomena are such that real tests can not be organized, the only possibility to test is to make a model and test it • do not mix spatial models of phenomena and spatial data models !!!!! Malli ... • ”Malli on yksinkertaistettu tutkimuksen kohteen esitys, joka on aikaansaatu kuvaamisen, selittämisen, ennustamisen tai suunnittelun tarpeisiin. Spatiaalinen malli on tutkimuskohteen sijainti/ominaisuus malli. Spatiotemporaalinen malli on tutkimuksen kohteen sijainti/ominaisuus/aika malli.” (Fisher et al., 1996) Model ... • ”A model is a simplified presentation of the object of study, made for the purposes of description, explanation, forecasting or planning. Spatial model is a spatial/attribute model of the object. Spatio-temporal model is a spatial/attribute/temporal model of the object.” (Fisher et al., 1996) • todellinen maailma edellyttää todellisessa maailmassa tehtäviä johtopäätöksiä • niitä voidaan auttaa tutkimalla todellisuuden ilmiötä, tunnistamalla sen olennaiset tekijät ja valittujen tekijöiden väliset suhteet > malli • malli formuloidaan matemaattiseksi malliksi, joka voidaan ratkaista • mallin rajoitukset ja yksinkertaistukset otetaan huomioon johtopäätöksiä tehtäessä • in the reality we need conclusions made in the reality • we can support them by analysing the real phenomena, by identifying the essential factors and relationships between selected objects > model • a mathematical model is formulated, a mathematical model can be solved • the simplifications and restrictions of the model are taken into account when solving the model Spatiaalisten mallien käyttöalueita • mallinnetaan fyysisiä/ympäristöilmiöitä sekä sosiaalisia ja taloudellisia prosesseja – – – – – – – – – sää, ilmasto maaperä, korkeus veden ekosysteemi eroosio, pohjaveden liike alueellinen talouskehitys muuttoliike palvelujen ja tuotantolaitosten sijoittelu kuljetus kaupungin maankäyttö Use of spatial models • physical or environmental phenomena, social and economical processes – – – – – – – – – weather, climate soil, elevation water ecosystems erosion local economical development migration location of services and industrial plants transportation urban land use DEM-pohjainen tulvamalli: jos merenpinta nousee 5 m Helsingin alueella Tulvamallissa käytetään korkeusmallia. Maanjäristyksen seurausmalli Case: Maanjäristys Rhodoksella/UHHA Näitä malleja kehittävät seismologit. Esimerkki on yksinkertaistetusta mallista. Kaasuvuodon leviämismalli Case: FinnChemicals, Kuusankoski/UHHA Tämän mallin on kehittänyt Ilmatieteen laitos. Esimerkkikuva on yksinkertaistetusta mallista. sivu 109 Väestömalli yhdessä kaasuvuotoa kuvaavan mallin kanssa Vaarallinen alue on kuvattu ympyrällä, kaasuvuoto sinisellä ja väestö vihreällä. Korpi,J., ZhangZhe, 2008 Vaarallinen alue pommi-iskussa; yksinkertaistetulla paineaaltomallilla. Paineaaltomalli: Paineen leviäminen pommi-iskussa + vahingoittuneiden ihmisen määrä Hyvin yksinkertainen malli paineaallon vaikutuksesta ja vahingoittuneiden ihmisten määrästä. Spatiaaliset mallit ovat erilaisia • sovellusalueeltaan, mittakaavaltaan • mallityypiltään – deterministiset - perustuvat kaavoihin, jotka tuottavat aina samoilla inputeilla samat outputit – stokastiset - perustuvat ilmiöiden satunnaisuuteen – systeemimallit kuvaavat osaa reaalimaailmaa, kohteet ja niiden väliset suhteet – optimointimallit ratkaisevat tavoitefunktion – simulointimallit jäljittelevät todellisuutta luomalla realisaatioita annettujen sääntöjen mukaan – deskriptiiviset spatio-temporaaliset mallit kuvaavat ilmiön aika-paikka-vaihtelua Spatial models are different • application field, scale • type of the model – determininistic – based on the formula that produces with given inputs always equal outputs – stochastic – based on randomness – system models describe a given part of reality with relationships – optimization models, solve the goal function – simulation models produce realizations according to given rules – descriptive spatio-temporal models Esimerkkejä spatiaalisista malleista • ilmastomalli, merimalli – 4d vokselimalleja – hallintaan fysikaalisia/biologisia ilmiöitä – lähtö- ja tukiaineistona käytetään GIS-aineistoja – mallien tuloksia visualisoidaan karttoina • metsäpalojen simulointimallit – GIS –lähtöaineiston pohjalla • täsmäviljelyn operatiiviset mallit Examples of spatial models • climate model, sea model • 4d voxel models • physical/biological phenomena • GIS data as source and support data • models are visualized as maps • simulation models of forest fires • GIS –source data • operative models for agriculture • korkeusmalli on useimpien fyysisen ympäristön analyysien pohjana – hydrologiset sovellukset, valumamallit – maisema-analyysi ja rakentaminen – sotilassovellukset, simulaattorit – radioverkon suunnittelu • yhteiskunnallis-taloudelliset mallit – väestö, tuotanto • elevation model is used in most of the analysis for physical reality – hydrological applications, drainage models – building and landscape analysis – military applications, simulators – radio network planning • socio-econimical models – population, production Paikkatietomallin toteutus • GIS-toteutuksessa kohteet ja pinnat voidaan toteuttaa joko vektorimallilla tai rasterimallilla • periaatteessa samoja analyysejä voidaan tehdä kummallakin (vrt. reittioptimoinnit verkossa ja kustannuspinnalla) • valinta riippuu siitä, mikä on luontevin tapa mallintaa kohdesysteemiä • esim. 4d-vokselimallit ilmaston ja meren mallinnukseen Implementing the GI model • objects and fields can be implemented as rasters or vector models • in principle the same analysis can be made for raster and vector models • the selection of the implemntation is based on the decision about the most natural presemtation • for example 4-d voxel models for climate models Ongelma ohjaa datan mallinnusta ja datamalli ympäristön valintaa • ongelma ohjaa tietomallin valintaa, tietomalli ohjaa ohjelmiston/algoritmin valintaa – merimalli ja ilmastomalli: vokselimalli, 3d/4d-hila – näkyvyys- ja kuuluvuusanalyysit, valuma-analyysit, 2,5 d-hila tai TIN-verkko – kuljetus- ja sijoitteluongelmat: verkkomalli tai pikselimalli, 2d-hila – väestöön liittyvät analyysit, 2d aluejako – epidemiologinen analyysi: pisteaineisto Problem > data model> implementation environment • the data model is derived from the problem and the selection of the software/algorithm is derived from the data model – sea model and climate model: voxel model, 3d/4d-grid – visibility analyses, drainage analyses, 2,5 d-raster or TIN-network – transportation and location problems: graph model or pixel model, 2d-raster – demographic analyses, 2d polygon maps – epidemiological analyses: point sets Yhteenvetoa • pistejoukot ja jatkumot helpoimpia mieltää ja mallintaa prosessseina • spatiaalisen vaihtelun oikea mallintaminen ja mittaaminen on keskeinen ongelma • todellisuuden abstraktiotaso (mittakaava) vaikuttaa olennaisesti dataan ja tuloksiin Some conclusions • point sets and fields are easy to understand and model as processes • modeling and measuring spatial dependency correctly is one of the major problems • the level of abstraction of reality has a big effect to the data and results Kirjallisuutta • Sullivan,D., Unwin,D., Geographic information Analysis, 1. painos, luvut 1,2 ja 3, (7),8 – Malczewski,J., GIS and Multicriteria Decision Analysis, 1999,luvut 1 ja 2 – Fisher,M., Scholten,H., Unwin,D., Spatial Analytical Perspectives on GIS, 1996. luku 1 ja luku2 – Bailey,T., Gatrell,A., Interactive Spatial Data Analysis,1995. Introduction. – Burrough,P., McDonnell,R., Principles of Geographical Information Systems, 1998. – Tomlin,D., GIS and Cartographic Modeling. – Longley,P., Goodchild,M.,Maguire,D., Rhind,D.,GIS, Vol1, sectio 1c, 1999. – Openshaw,P., Abrahart, R., GeoComputation, 2000. Literature • Sullivan,D., Unwin,D., Geographic information Analysis, 1st edition, Chapters 1,2,3, (7), 8 – Malczewski,J., GIS and Multicriteria Decision Analysis, 1999, Chapters1 ja 2 – Fisher,M., Scholten,H., Unwin,D., Spatial Analytical Perspectives on GIS, 1996. Ch 1 ja Ch 2 – Bailey,T., Gatrell,A., Interactive Spatial Data Analysis,1995. Introduction – Burrough,P., McDonnell,R., Principles of Geographical Information Systems, 1998. – Tomlin,D., GIS and Cartographic Modeling. – Longley,P., Goodchild,M.,Maguire,D., Rhind,D.,GIS, Vol1, sectio 1c, 1999. – Openshaw,P., Abrahart, R., GeoComputation, 2000.
© Copyright 2024