Operasjonsanalytiske emner Del 23 Forecasting 1 - Mønster Prognosemodeller basert på Tidsserieanalyse BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 1 Introduksjon til tidsserieanalyser En tidsserie er en samling av observasjoner for en kvantifiserbar variabel registrert i kronologisk tidsrekkefølge. Eksempel Børsindekser Historiske data over salg, lager, antall kundebesøk, rentesatser, kostnader, etc. Bedrifter er ofte interessert i å predikere tidsserie-variabler. Ofte finnes ikke uavhengige variabler (X) som kan benyttes i en regresjonsmodell for en tidsserievariabel (Y). I tidsserieanalyser analyserer vi den historiske utviklingen til en variabel (Y) for å kunne predikere dens framtidige utvikling. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 2 Prediksjoner basert på tidsserieanalyse Som å kjøre en bil ved å se på veien via speilet bakover: Vi ser hvor veien har svingt tidligere, og forsøker å styre bilen deretter! BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 3 Noen tidsserieuttrykk Stasjonære data – en tidsserievariabel som ikke viser noen signifikant trend opp eller ned over tid. Ikke-stasjonære data – en tidsserievariabel som viser en tydelig trend opp eller ned over tid. Sesong data – en tidsserievariabel som viser et repeterende mønster med jevne intervall over tid. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 4 Typer mønster i tidsseriedata Horisontal Når observasjonene varierer rundt et konstant nivå eller gjennomsnitt. Det er ingen konsistente vedvarende økninger eller reduksjoner over tid. En slik tidsserie har et stasjonært gjennomsnitt. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 5 Typer mønster i tidsseriedata Trend Når observasjonene øker eller faller vedvarende over en lengre tidsperiode. Trend er lang-tids komponenten som representerer en vedvarende endring over tid. Observert verdi Syklus topp Trendlinje Syklus bunn Tid BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 6 Typer mønster i tidsseriedata Sykluser Når observasjonene inneholder økninger og reduksjoner uten fast lengde, tyder det på sykliske variasjoner. Sykluser er bølgelignende endringer rundt en trendlinje, eller et ellers stabilt gjennomsnitt. Sykluser er som regel et resultat av generelle økonomiske variasjoner. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 7 Typer mønster i tidsseriedata Sesonger Sesongvariasjoner er vedvarende repeterende mønster, vanligvis over ett år. Sesonglengden kan være kvartal, måned, etc. Årsaken kan være årstiden/været, helgedager(jul), skolestart, etc. Det kan være sesongvariasjoner rundt et stabilt nivå (horisontalt), eller rundt en trendlinje. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 8 Sesongvariasjoner Kilowatts 1200 1000 800 600 400 200 0 1 5 9 BØK710 OPERASJONSANALYTISKE EMNER 13 17 21 25 29 33 37 41 45 Rasmus Rasmussen 9 Utforske datamønster med autokorrelasjonsanalyse Når en variabel måles over tid, vil ofte observasjoner fra forskjellige perioder korrelere med hverandre. Autokorrelasjon er korrelasjoner mellom observasjoner fra samme tidsserie, men forskjøvet i tid. Mønster som trend og sesongvariasjoner kan ofte avsløres via autokorrelasjonsanalyse. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 10 Autokorrelasjonsanalyse Autokorrelasjonskoeffisienten rk for”lag k” måler autokorrelasjonen mellom Yt og Yt-k n Y Y Y rk t k 1 n Y Y t 1 BØK710 OPERASJONSANALYTISKE EMNER t k t Y 2 t Rasmus Rasmussen 11 Correlogram Correlogram 1.0 0.8 ACF 0.6 Upper 0.4 Lower ACF 0.2 0.0 1 2 3 4 5 6 -0.2 -0.4 -0.6 -0.8 -1.0 BØK710 OPERASJONSANALYTISKE EMNER Observation/Lags Rasmus Rasmussen 12 Autokorrelasjonsanalyse (Ex. 3-1) BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 13 Autokorrelasjonsanalyse Hvis en serie er ”random”, så er rk for enhver k nær null. Påfølgende verdier i tidsserien er ikke korrelerte. Hvis en serie har trend, så vil Yt og Yt-1 være sterkt korrelert, og autokorrelasjonskoeffisienten er typisk signifikant forskjellig fra 0 for de første k ”lags”, og reduseres gradvis mot 0 når k øker. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 14 Autokorrelasjonsanalyse Hvis en serie har sesong, så vil Yt og Yt-p være sterkt korrelert, der p angir antall sesonger pr. syklus. For kvartalsdata vil r4, r8, etc. ha signifikante verdier. For månedsdata vil korrelasjonskoeffisienter som er multiplum av 12 ha høye verdier, osv. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 15 Signifikanstest av autokorrelasjon Variansen til autokorrelasjonskoeffisienten har ingen funnet et eksakt uttrykk for. Hvis tidsserien er helt tilfeldig (”random”) er rk normalfordelt med: r 0 k 1 rk n BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 16 Signifikanstest av autokorrelasjon Om en antar at før lag k (k>1) er alle rk ≠ 0 og etter lag k er alle rk = 0, da kan følgende formel benyttes: k 1 r k ( k 1) 1 2 ri 2 BØK710 OPERASJONSANALYTISKE EMNER i 1 n Rasmus Rasmussen 17 Konfidensintervall for autokorrelasjon H 0 : k 0 H1 : k 0 t rk k r k rk= observert korrelasjon ρk = «sann» korrelasjon For alle k, forkast H0 hvis |t| > t/2;df=n-k Konfidensintervall: Aksepter H0 hvis: t( /2;df n k ) rk rk t( /2;df n k ) rk BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 18 Signifikanstest av autokorrelasjon I steden for å teste alle rk verdiene en og en, kan en komplementær metode være å teste et helt sett av rk verdier, f.eks. teste om de 10 første er signifikant forskjellig fra et sett der alle 10 er null. En vanlig portmanteau test (Ljung & Box): rk2 Qm n(n 2) k 1 n k m BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 19 Signifikant Q Qm har en chi-kvadrat fordeling med m (antall ”lags”) frihetsgrader. Hvis Q anvendes på autokorrelasjonene i residualene av en prediksjonsmetode, er antall frihetsgrader lik m minus antall parameter i metoden som er estimert basert på dataene. CHIINV(α;df) brukes for å finne kritisk øvre verdi. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 20 Tilfeldig datamønster? (Ex. 3-3) En tallserie på 40 data er genert tilfeldig. Autokorrelasjonskoeffisientene bør da teoretisk være null. Hvert tilfeldig utvalg av alle mulige utvalg på 40 vil produsere forskjellige autokorrelasjoner. De fleste utvalg vil ha rk ≈ 0, men noen kan tilfeldigvis produsere store rk. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 21 Tilfeldig datamønster? (Ex. 3-3) BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 22 Stasjonære data En stasjonær dataserie har stabilt/konstant gjennomsnitt og varians over tid. Numbers 1000 900 800 700 600 500 400 300 200 100 0 1 3 5 7 9 BØK710 OPERASJONSANALYTISKE EMNER 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 Rasmus Rasmussen 23 Har datene trend? En stasjonær dataserie varierer rundt et konstant nivå, uten vedvarende endringer. En serie som inneholder trend er ikke-stasjonær. For ikke-stasjonære data vil autokorrelasjonen være høy for flere perioder/lags. Differanser brukes for å fjerne trend fra en ikkestasjonær dataserie. BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 24 Fjerne trend vha. differanser BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 25 Data med trend (Ex. 3-4) Revenue 60000 50000 40000 30000 20000 10000 0 1 3 5 7 9 BØK710 OPERASJONSANALYTISKE EMNER 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 Rasmus Rasmussen 26 Data med trend (Ex. 3-4) ACF Upper Lower LBQ Q 0.955 0.308 -0.308 41.98 3.84 0.914 0.517 -0.517 81.44 5.99 Forts. Correlogram 1.0 0.874 0.652 -0.652 118.38 7.81 0.794 0.755 -0.755 149.69 9.49 0.716 0.831 -0.831 175.79 11.07 0.4 0.634 0.887 -0.887 196.81 12.59 0.2 0.545 0.929 -0.929 212.76 14.07 0.452 0.959 -0.959 224.06 15.51 0.363 0.979 -0.979 231.55 16.92 0.279 0.991 -0.991 236.12 18.31 0.196 0.999 -0.999 238.46 19.68 0.118 1.003 -1.003 239.33 21.03 0.052 1.004 -1.004 239.51 22.36 0.8 ACF 0.6 0.0 -0.2 1 2 3 4 5 6 7 8 9 10 11 12 13 -0.4 -0.6 -0.8 -1.0 BØK710 OPERASJONSANALYTISKE EMNER Observation/Lags Rasmus Rasmussen 27 Differansedata (Ex. 3-4) Forts Diff. 5000 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 -5000 -10000 -15000 -20000 BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 28 Differansedata (Ex. 3-4) Forts ACF Upper Lower LBQ Q -0.083 0.312 -0.312 0.31 3.84 0.057 0.314 -0.314 0.46 5.99 0.305 0.315 -0.315 4.85 7.81 ACF Correlogram 1.0 0.342 -0.342 4.87 9.49 -0.040 0.342 -0.342 4.95 11.07 -0.043 0.343 -0.343 5.05 12.59 0.044 0.343 -0.343 5.15 14.07 0.8 Lower 0.6 0.4 0.2 ACF 0.020 Upper 0.0 1 -0.091 0.344 -0.344 5.60 15.51 -0.089 0.346 -0.346 6.04 16.92 -0.022 0.348 -0.348 6.07 18.31 -0.6 -0.052 0.348 -0.348 6.23 19.68 -0.8 -0.220 0.349 -0.349 9.21 21.03 -1.0 -0.045 0.362 -0.362 9.34 22.36 BØK710 OPERASJONSANALYTISKE EMNER 2 3 4 5 6 7 8 9 10 11 12 13 -0.2 -0.4 Observation/Lags Rasmus Rasmussen 29 Er det sesongvariasjoner? Hvis en dataserie inneholder sesongvariasjoner, vil et mønster av svingninger repeteres med jevne mellomrom (vanligvis hvert år). Observasjoner for tilsvarende periode i forskjellige år vil være korrelerte. Autokorrelasjonskoeffisientene for k=p, 2p, etc. vil være signifikant forskjellig fra null. (p=4 for kvartal, 12 for mnd.) BØK710 OPERASJONSANALYTISKE EMNER Rasmus Rasmussen 30 Data med sesonger (Ex. 3-5) Sales 500 450 400 350 300 250 200 150 100 1 5 9 BØK710 OPERASJONSANALYTISKE EMNER 13 17 21 25 29 33 37 41 Rasmus Rasmussen 31 Data med sesonger (Ex. 3-5) ACF Upper Lower LBQ Q 0.393 0.278 -0.278 8.50 3.84 0.154 0.318 -0.318 9.83 5.99 1.0 0.294 0.324 -0.324 14.77 7.81 0.8 0.744 0.344 -0.344 47.11 9.49 0.6 0.151 0.452 -0.452 48.47 11.07 0.4 -0.153 0.456 -0.456 49.90 12.59 0.2 -0.047 0.460 -0.460 50.04 14.07 0.347 0.460 -0.460 57.72 15.51 -0.2 -0.183 0.480 -0.480 59.90 16.92 -0.4 -0.435 0.485 -0.485 72.53 18.31 -0.6 -0.315 0.515 -0.515 79.33 19.68 -0.8 0.091 0.529 -0.529 79.91 21.03 -1.0 -0.353 0.531 -0.531 88.90 22.36 ACF ACF Correlogram Upper Lower 0.0 1 BØK710 OPERASJONSANALYTISKE EMNER Forts. 2 3 4 5 6 7 8 9 10 11 12 13 Observation/Lags Rasmus Rasmussen 32
© Copyright 2024