Operasjonsanalytiske emner

Operasjonsanalytiske
emner
Del 23
Forecasting
1 - Mønster
Prognosemodeller basert på
Tidsserieanalyse
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
1
Introduksjon til tidsserieanalyser
En tidsserie er en samling av observasjoner for en
kvantifiserbar variabel registrert i kronologisk tidsrekkefølge.
Eksempel
Børsindekser
Historiske data over salg, lager, antall kundebesøk,
rentesatser, kostnader, etc.
Bedrifter er ofte interessert i å predikere tidsserie-variabler.
Ofte finnes ikke uavhengige variabler (X) som kan benyttes i en
regresjonsmodell for en tidsserievariabel (Y).
I tidsserieanalyser analyserer vi den historiske utviklingen til
en variabel (Y) for å kunne predikere dens framtidige utvikling.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
2
Prediksjoner basert på tidsserieanalyse
Som å kjøre en bil ved å se på veien via speilet
bakover:
Vi ser hvor veien har svingt tidligere, og forsøker å
styre bilen deretter!
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
3
Noen tidsserieuttrykk
Stasjonære data – en tidsserievariabel som ikke viser
noen signifikant trend opp eller ned over tid.
Ikke-stasjonære data – en tidsserievariabel som viser
en tydelig trend opp eller ned over tid.
Sesong data – en tidsserievariabel som viser et
repeterende mønster med jevne intervall over tid.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
4
Typer mønster i tidsseriedata
Horisontal
Når observasjonene varierer rundt et konstant nivå
eller gjennomsnitt.
Det er ingen konsistente vedvarende økninger eller
reduksjoner over tid.
En slik tidsserie har et stasjonært gjennomsnitt.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
5
Typer mønster i tidsseriedata
Trend
Når observasjonene øker eller faller vedvarende
over en lengre tidsperiode.
Trend er lang-tids komponenten som representerer
en vedvarende endring over tid.
Observert
verdi
Syklus topp
Trendlinje
Syklus bunn
Tid
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
6
Typer mønster i tidsseriedata
Sykluser
Når observasjonene inneholder økninger og
reduksjoner uten fast lengde, tyder det på sykliske
variasjoner.
Sykluser er bølgelignende endringer rundt en
trendlinje, eller et ellers stabilt gjennomsnitt.
Sykluser er som regel et resultat av generelle
økonomiske variasjoner.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
7
Typer mønster i tidsseriedata
Sesonger
Sesongvariasjoner er vedvarende repeterende
mønster, vanligvis over ett år.
Sesonglengden kan være kvartal, måned, etc.
Årsaken kan være årstiden/været, helgedager(jul),
skolestart, etc.
Det kan være sesongvariasjoner rundt et stabilt
nivå (horisontalt), eller rundt en trendlinje.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
8
Sesongvariasjoner
Kilowatts
1200
1000
800
600
400
200
0
1
5
9
BØK710 OPERASJONSANALYTISKE EMNER
13
17
21
25
29
33
37
41
45
Rasmus Rasmussen
9
Utforske datamønster med
autokorrelasjonsanalyse
Når en variabel måles over tid, vil ofte observasjoner
fra forskjellige perioder korrelere med hverandre.
Autokorrelasjon er korrelasjoner mellom
observasjoner fra samme tidsserie, men forskjøvet i
tid.
Mønster som trend og sesongvariasjoner kan ofte
avsløres via autokorrelasjonsanalyse.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
10
Autokorrelasjonsanalyse
Autokorrelasjonskoeffisienten rk for”lag k” måler
autokorrelasjonen mellom Yt og Yt-k
n
 Y  Y Y
rk  t  k 1
n
 Y  Y 
t 1
BØK710 OPERASJONSANALYTISKE EMNER
t k
t
Y 
2
t
Rasmus Rasmussen
11
Correlogram
Correlogram
1.0
0.8
ACF
0.6
Upper
0.4
Lower
ACF
0.2
0.0
1
2
3
4
5
6
-0.2
-0.4
-0.6
-0.8
-1.0
BØK710 OPERASJONSANALYTISKE EMNER
Observation/Lags
Rasmus Rasmussen
12
Autokorrelasjonsanalyse (Ex. 3-1)
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
13
Autokorrelasjonsanalyse
Hvis en serie er ”random”, så er rk for enhver k nær
null. Påfølgende verdier i tidsserien er ikke korrelerte.
Hvis en serie har trend, så vil Yt og Yt-1 være sterkt
korrelert, og autokorrelasjonskoeffisienten er typisk
signifikant forskjellig fra 0 for de første k ”lags”, og
reduseres gradvis mot 0 når k øker.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
14
Autokorrelasjonsanalyse
Hvis en serie har sesong, så vil Yt og Yt-p være sterkt
korrelert, der p angir antall sesonger pr. syklus.
For kvartalsdata vil r4, r8, etc. ha signifikante verdier.
For månedsdata vil korrelasjonskoeffisienter som er
multiplum av 12 ha høye verdier, osv.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
15
Signifikanstest av autokorrelasjon
Variansen til autokorrelasjonskoeffisienten har ingen
funnet et eksakt uttrykk for.
Hvis tidsserien er helt tilfeldig (”random”) er rk
normalfordelt med:
r  0
k
1
 rk 
n
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
16
Signifikanstest av autokorrelasjon
Om en antar at før lag k (k>1) er alle rk ≠ 0 og etter lag
k er alle rk = 0, da kan følgende formel benyttes:
k 1
r
k ( k 1)

1  2 ri 2
BØK710 OPERASJONSANALYTISKE EMNER
i 1
n
Rasmus Rasmussen
17
Konfidensintervall for autokorrelasjon
 H 0 : k  0


 H1 :  k  0 
t
rk   k
r
k
rk= observert korrelasjon
ρk = «sann» korrelasjon
For alle k, forkast H0 hvis |t| > t/2;df=n-k
Konfidensintervall: Aksepter H0 hvis:
t( /2;df  n  k )   rk  rk  t( /2;df  n  k )   rk
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
18
Signifikanstest av autokorrelasjon
I steden for å teste alle rk verdiene en og en, kan en
komplementær metode være å teste et helt sett av rk
verdier, f.eks. teste om de 10 første er signifikant
forskjellig fra et sett der alle 10 er null.
En vanlig portmanteau test (Ljung & Box):
rk2
Qm  n(n  2)
k 1 n  k
m
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
19
Signifikant Q
Qm har en chi-kvadrat fordeling med m (antall ”lags”)
frihetsgrader.
Hvis Q anvendes på autokorrelasjonene i residualene
av en prediksjonsmetode, er antall frihetsgrader lik m
minus antall parameter i metoden som er estimert
basert på dataene.
CHIINV(α;df) brukes for å finne kritisk øvre verdi.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
20
Tilfeldig datamønster? (Ex. 3-3)
En tallserie på 40 data er genert tilfeldig.
Autokorrelasjonskoeffisientene bør da teoretisk være
null.
Hvert tilfeldig utvalg av alle mulige utvalg på 40 vil
produsere forskjellige autokorrelasjoner.
De fleste utvalg vil ha rk ≈ 0, men noen kan tilfeldigvis
produsere store rk.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
21
Tilfeldig datamønster? (Ex. 3-3)
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
22
Stasjonære data
En stasjonær dataserie har stabilt/konstant
gjennomsnitt og varians over tid.
Numbers
1000
900
800
700
600
500
400
300
200
100
0
1
3
5
7
9
BØK710 OPERASJONSANALYTISKE EMNER
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
Rasmus Rasmussen
23
Har datene trend?
En stasjonær dataserie varierer rundt et konstant
nivå, uten vedvarende endringer.
En serie som inneholder trend er ikke-stasjonær.
For ikke-stasjonære data vil autokorrelasjonen være
høy for flere perioder/lags.
Differanser brukes for å fjerne trend fra en ikkestasjonær dataserie.
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
24
Fjerne trend vha. differanser
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
25
Data med trend (Ex. 3-4)
Revenue
60000
50000
40000
30000
20000
10000
0
1
3
5
7
9
BØK710 OPERASJONSANALYTISKE EMNER
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
Rasmus Rasmussen
26
Data med trend (Ex. 3-4)
ACF
Upper
Lower
LBQ
Q
0.955
0.308
-0.308
41.98
3.84
0.914
0.517
-0.517
81.44
5.99
Forts.
Correlogram
1.0
0.874
0.652
-0.652
118.38
7.81
0.794
0.755
-0.755
149.69
9.49
0.716
0.831
-0.831
175.79
11.07
0.4
0.634
0.887
-0.887
196.81
12.59
0.2
0.545
0.929
-0.929
212.76
14.07
0.452
0.959
-0.959
224.06
15.51
0.363
0.979
-0.979
231.55
16.92
0.279
0.991
-0.991
236.12
18.31
0.196
0.999
-0.999
238.46
19.68
0.118
1.003
-1.003
239.33
21.03
0.052
1.004
-1.004
239.51
22.36
0.8
ACF
0.6
0.0
-0.2
1
2
3
4
5
6
7
8
9
10
11
12
13
-0.4
-0.6
-0.8
-1.0
BØK710 OPERASJONSANALYTISKE EMNER
Observation/Lags
Rasmus Rasmussen
27
Differansedata (Ex. 3-4) Forts
Diff.
5000
0
1
3
5
7
9
11
13
15
17
19
21
23
25
27
29
31
33
35
37
39
41
43
-5000
-10000
-15000
-20000
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
28
Differansedata (Ex. 3-4) Forts
ACF
Upper
Lower
LBQ
Q
-0.083
0.312
-0.312
0.31
3.84
0.057
0.314
-0.314
0.46
5.99
0.305
0.315
-0.315
4.85
7.81
ACF
Correlogram
1.0
0.342
-0.342
4.87
9.49
-0.040
0.342
-0.342
4.95
11.07
-0.043
0.343
-0.343
5.05
12.59
0.044
0.343
-0.343
5.15
14.07
0.8
Lower
0.6
0.4
0.2
ACF
0.020
Upper
0.0
1
-0.091
0.344
-0.344
5.60
15.51
-0.089
0.346
-0.346
6.04
16.92
-0.022
0.348
-0.348
6.07
18.31
-0.6
-0.052
0.348
-0.348
6.23
19.68
-0.8
-0.220
0.349
-0.349
9.21
21.03
-1.0
-0.045
0.362
-0.362
9.34
22.36
BØK710 OPERASJONSANALYTISKE EMNER
2
3
4
5
6
7
8
9
10
11
12
13
-0.2
-0.4
Observation/Lags
Rasmus Rasmussen
29
Er det sesongvariasjoner?
Hvis en dataserie inneholder sesongvariasjoner, vil et
mønster av svingninger repeteres med jevne
mellomrom (vanligvis hvert år).
Observasjoner for tilsvarende periode i forskjellige år
vil være korrelerte.
Autokorrelasjonskoeffisientene for k=p, 2p, etc. vil
være signifikant forskjellig fra null.
(p=4 for kvartal, 12 for mnd.)
BØK710 OPERASJONSANALYTISKE EMNER
Rasmus Rasmussen
30
Data med sesonger (Ex. 3-5)
Sales
500
450
400
350
300
250
200
150
100
1
5
9
BØK710 OPERASJONSANALYTISKE EMNER
13
17
21
25
29
33
37
41
Rasmus Rasmussen
31
Data med sesonger (Ex. 3-5)
ACF
Upper
Lower
LBQ
Q
0.393
0.278
-0.278
8.50
3.84
0.154
0.318
-0.318
9.83
5.99
1.0
0.294
0.324
-0.324
14.77
7.81
0.8
0.744
0.344
-0.344
47.11
9.49
0.6
0.151
0.452
-0.452
48.47
11.07
0.4
-0.153
0.456
-0.456
49.90
12.59
0.2
-0.047
0.460
-0.460
50.04
14.07
0.347
0.460
-0.460
57.72
15.51
-0.2
-0.183
0.480
-0.480
59.90
16.92
-0.4
-0.435
0.485
-0.485
72.53
18.31
-0.6
-0.315
0.515
-0.515
79.33
19.68
-0.8
0.091
0.529
-0.529
79.91
21.03
-1.0
-0.353
0.531
-0.531
88.90
22.36
ACF
ACF
Correlogram
Upper
Lower
0.0
1
BØK710 OPERASJONSANALYTISKE EMNER
Forts.
2
3
4
5
6
7
8
9
10
11
12
13
Observation/Lags
Rasmus Rasmussen
32