시계열분석에 대한 R 패키지의 활용*

Journal of the Korean Data Analysis Society (February 2011)
Vol. 13, No. 1 (B), pp. 331-341
시계열분석에 대한 패키지의 활용
*
R
김희재
1
1)
요약
시계열자료에 대한 분석 및 예측을 위한 통계패키지는
그리고
등
을 일반적으로 사용한다 상기의 패키지들은 서로 여러 가지 장단점이 있을 수 있으나 공통된
점은 고가의 유료 패키지라는 점이다 본 연구에서는 무료 공개 소프트웨어인 패키지를 활용
하여 시계열자료에 대한 기본적인 분석과
모형 및 승법계절
모형에 대한 분석
및 예측이 가능함을 보이며 또한
그리고
을 사용하는 경우에 대한 비교표를
제공하여 시계열분석을 위한 사용자들에게 여러 가지 상황에 따르는 선택의 폭을 넓히며 패
키지를 이용하여 시계열분석에 대한 연구개발에 일조토록 하는데 연구의 목적을 두었다
주요용어 시계열분석 패키지
모형 승법계절
모형
SAS, SPSS, MINITAB
S-plus
.
.
R
ARIMA
SAS, SPSS
ARIMA
MINITAB
R
.
:
, R
, ARIMA
,
ARIMA
.
서론
1.
시스템의 들은 년
의
대학교 통계학과의
과
교수에 의해 처음으로 만들어졌으며 년부터
즉 개발의
처음과 종료까지 무료 공개 소프트웨어로 등록되어 재단의
홈페이지를 통해서 무료로 배포되고 있다 현재
까지 개발되어
있으며 특별한 관심을 갖는 것은 자료의 조직화 시각화 분석을 목적으로 개발된 객체지향형 프
로그램 언어인 기존의 가 갖고 있는 환경 사용법이 거의 일치하면서도 무료이며 특히 소스
가 공개되어 있기 때문에 사용자의 사용목적에 따라 자체의 수정도 가능하다는 점을 들 수 있
다 은 에 비해 자유로운 개발환경과 수많은 의 제공으로 여러 연구 분야에 두루 사
용되고 있으며 특히 생물학의
분석 분야에서는 표준 시스템으로 사용되고 있다
은
그리고
환경 등 대부분의 컴퓨팅 환경을 지원하고 또한 은 객체지
향형 프로그램 언어이므로
등의 언어와 인터페이스가 가능하고
각종 의 데이터에 접근할 수도 있으며 최근에는
를 에 탑재하
여 사용 환경에서 의 다양한
들을 활용하고 있다
패키지를 활용한 기존의 연구에는 샘플링 검사에 대한 시스템의 활용에 관한 고찰 김희재
과 을 이용한
수명분포의 모수추정 김희재
등을 들 수 있으며 시계열분석에
관한 최근의 연구에는 주택 가격과 거시경제 변수간의 시계열분석 김연형 등
금융시계열의
R
library
1989
New Zealand
Ross Ihaka
Auckland
, 1991
Robert Gentleman
GPL(general public license)
,
CRAN(comprehensive
R
R
network)
.
,
Version 2.12.0 (2010-10-15)
,
S-plus
archive
,
,
R
. R
S-plus
library
DNA microarray
UNIX, Windows,
. R
Macintosh
R
JAVA, Python, C, C++, FORTRAN
DBMS
SPSS-R integration package
SPSS
R
library
.
R
2003)
R
R
Weibull
(
(
, 2005)
,
(
이 논문은 학년도 경성대학교 학술연구비지원에 의하여 연구되었음
부산광역시 남구 대연동
경성대학교 통계정보학과 교수
접수 년 월 일 수정 년 월 일 게재확정
*
SPSS
2010
, 2006),
.
1
608-736
110-1,
[
2010
12
23
. E-mail : [email protected]
;
2011
1
23
;
년 월 일
2011
1
26
]
,
김희재
332
상관행렬 속성분해를 위한 새로운 방법 연구 엄철준 등
계열 자료의 패턴 분류 전새봄 등
등을 들 수 있다
(
(
, 2007)
, 2009)
2.
그리고 스펙트럼 분석을 이용한 시
.
시계열분석에 대한 패키지의 활용
R
시계열자료는 분석 목적에 따라 진동수 영역에서의 분석법과 시간영역에서의 분석법으로 대별
될 수 있으며 시간영역에서의 분석법으로는 평활법 분해법 그리고 확률과정에 의한 분석법 등으
로 대별될 수 있다 확률과정에 의한 분석법은 흔히
의
모형 및
모형
의 활용으로 시계열자료를 분석하고 예측한다 주어진 시계열자료를
모형으로 분석 및
예측하는 경우 일반적으로
모형 또는 승법계절
모형으로 분석 및 예측을 하며 또
한 분석에 사용되는 도구 패키지 로는 흔히
및
등이 사용되고 있으나
패키지를 활용하는 경우는 거의 전무한 것이 작금의 실정이다
본 연구에서는 패키지를 활용하여
모형에 대한 자기회귀함수
와 편자기상관함수
에 대한 모의시계열의 생성과 그래
픽적 고찰을 기타의 패키지들과 비교하며 또한 년 사분기부터 년 사분기까지의 우리나
라의 국내총생산 분기별 시계열자료 단위는 억 에 대하여 승법계절
모형의 수립과
예측 및 적합측도의 절차를 각 단계별로 기타의 패키지들과 비교하였다
2.1. 시계열자료의 생성과 시계열그림
주어진 시계열자료를 시계열속성을 갖는 자료로 변환하는 패키지 이하 의 함수는 이며
이를 활용한
는 다음과 같이 작성될 수 있다
《
》 시계열자료의 생성과 시계열그림
,
.
Box -Jenkins
.
ARIMA
Box-Jenkins
ARIMA
(
ARIMA
ARIMA
)
SAS, SPSS, MINITAB
R
S-plus
.
R
ARIMA
function)
(ACF: auto correlation
(PACF: partial autocorrelation function)
1970
(GDP)
(
10
1
2010
)
2
ARIMA
.
R
R script
(
R)
ts()
.
R script 1
gdp <- scan("e:/gdp.txt")
(gdp.ts <- ts(gdp, start=c(1970, 1), frequency=4))
plot.ts(gdp.ts)
나 혹은
등에서 각각의 명령문은 전체 프로그램의 일부분으로서 수행되지만
은 객체지향형 프로그램 언어이므로 독립된 함수 함수객체 가 각 단계별로 이들을 수행한다 또한
상용되는 기타 패키지들의
와의 관계는
과 같이 요약 정리할 수 있다
SAS
SPSS
MINITAB
R
(
key word
)
.
Table 1
.
Table 1. Generating time series and picture of time series
Package
Generating time series
Picture of time series
R
ts(gdp, start=c(1970, 1), frequency=4)
plot.ts(gdp.ts)
SAS
date=intnx('qtr','01jan1970'd, _n_-1);
format date yyq. ;
proc gplot ;
plot gdp*date=1;
SPSS
date quarter 1 4 year 1970.
tsplot var=gdp
/id=date_ .
index
tsplot 'Gdp' ;
index; connect .
MINITAB
시계열분석에 대한 R 패키지의 활용
333
시계열모형 구축을 위한 시계열자료의 부분선택
시계열속성을 갖는 시계열자료로부터 시계열모형 구축을 위한 시계열자료의 부분선택 기능의
함수는
이며 이를 활용한
는 다음과 같이 작성될 수 있다
《
》 시계열모형 구축을 위한 시계열자료의 부분선택
2.2.
window()
R script
R
.
R script 2
(zt <- window(gdp.ts, c(1970,1), c(2008,2)))
plot.ts(zt)
에서는 문에서 명령문으로 시계열자료를 선택하여 구축할 수 있으며 에서는
명령문으로 시계열자료를 부분 선택할 수 있다
에서는 명령문과 부명령문으로
부분 선택할 수 있다 시계열자료에 대한 부분선택 수행의 패키지별
를 요약 정리하면
와 같다
SAS
data
if
, SPSS
. MINITAB
copy
.
Table 2
use
use
key word
.
Table 2. Extracting the subset of the time series
Package
R
Extracting the subset of the time series
window(gdp.ts, c(1970,1), (2008,2))
SAS
if _n_ < 155;
SPSS
use year 1970 quarter 1 thru year 2008 quarter 2.
MINITAB
copy c1 into c2 ; use 1: 154 .
시계열의 분산과 추세 및 계절추세의 안정화
시계열자료에 대한 분산의 안정화 필요여부는 일반적으로 시계열 그래프를 사용하여 판별하며
분산의 안정화 필요시에는 흔히 변환 등을 이용하여 분산을 안정화시키고 추세 및 계절추세의
안정화는 일반차분 및 계절차분을 통하여 시계열자료를 안정화시키는데 시계열의 안정화에 관한
는 다음과 같이 작성될 수 있다
《
》 시계열의 분산과 추세 및 계절추세의 안정화
2.3.
,
log
R script
.
R script 3
lnzt <- log(zt)
dif1.lnzt <- diff(lnzt)
dif41.lnzt <- diff(dif1.lnzt, differences=4)
plot.ts(dif41.lnzt)
에서는 시계열 그래프 활용 이외에 매크로
를 이용하여 로그변환 전후의 또는
값의 비교에 의하여 분산안정화 필요여부를 결정할 수 있다 분산과 추세 및 계절추세의 안
정화 수행에 대한 패키지별
를 요약 정리하면
과 같다
SAS
%logtest
AIC
SBC
.
key word
Table 3
.
Table 3. Stabilization of variance, trend and seasonal trend
Package
Variance
Trend
Seasonal trend
R
log(zt)
diff(zt)
diff(zt, differences=#)
diff#(zt)
SAS
log(zt)
dif#(zt)
SPSS
ln(zt)
diff(zt)
sdif(zt)
MINITAB
loge(zt)
differ #
differ #
김희재
334
분산의 안정화는 자연대수 변환 이외에도 역수나 제곱근 등의 변환도 가능하며
에서 가
인 경우는 분기별 인 경우는 월별 시계열 자료인 경우에 해당되며 가 인 경우는 생략이 가
능하다
2.4. 모의 시계열의 생성
시계열  가 비정상 자기회귀 이동평균과정인
모형을 따르는 경우의 일반적인 형
태는  를 후진연산자 를 상수항      를  의  차분 시계열이라고 할 때 아래와 같이 나
타낼 수 있다
Table 3
4
, 12
#
#
1
.
-

,
ARIMA(p, d, q)

,


.
         
(2.1)
여기서




,           ⋯   ,          ⋯     .
모형에 대한 모의 시계열의 생성은 시계열분석의 학습이나 연구를 위하여 매우
중요하다고 할 수 있는데 나
에서는 인 경우 즉
모형인 경우는 사용
자가 명령문을 직접 작성하여 용이하게 생성할 수 있으나 가 이상인
모형에 대
한 모의 시계열의 생성은 다소 난해하다 특히 에서 명령문을 직접 작성하여
모형에 대한 모의 시계열을 생성하는 것은 매우 난해하다
에서는 시스템에서 제공하는 모의 시계열 생성함수
함수를 이용하여
모형에 대한 모의 시계열의 생성이 가능하다 에서는 또한 이론적인 자기상관함수 와 편자
기상관함수 에 대하여도 시스템에서 제공하는
함수의 이용이 가능하므로 이를 활
용하면 이론적인 자기상관함수 와 편자기상관함수 의 그래프도 쉽게 출력할 수가 있으
므로 시계열분석의 학습에 매우 유용하게 이용될 수 있다
《
》
모형에 대한 모의 시계열의 생성
ARIMA(p, d, q)
, SAS
MINITAB
d=0
, ARIMA(p, q)
d
.
1
SPSS
ARIMA(p, d, q)
ARIMA(p, d, q)
.
R
arima.sim()
q)
. R
(PACF)
ARIMA(p, d,
(ACF)
ARMAacf()
(ACF)
(PACF)
.
R script 4
ARIMA(p, d, q)
zt1=arima.sim(n=100, sd=sqrt(0.18), list(order=c(1,1,1), ar=0.9, ma=-0.23))
zt2=arima.sim(n=63, sd=sqrt(0.18), list(ar=c(0.89,-0.49),ma=c(-0.28, 0.25)))
plot.ts(zt1); plot.ts(zt2)
Figure 1.1. ARIMA(0.9,1,-0.23)
Figure 1.2. ARIMA(-0.49,0,0.25)
시계열분석에 대한 R 패키지의 활용
335
모형의 식별
모형 식별을 위한 통계량은 여러 가지가 있을 수 있는데 상용적으로는 흔히 자기상관함수
와 편자기상관함수 를 이용하여 식별한다 기타의 식별 통계량으로 역자기상관함수
등
을 이용할 수 있는데 각 패키지별 모형의 식별기능에 따른 비교는 통계 패키지에서의 시계열 분
석방법의 비교 김수화 등 를 참고하면 가능하다 패키지를 이용한 자기상관함수 와 편
자기상관함수 에 관한
는 다음과 같이 작성될 수 있다
《
》 자기상관함수 와 편자기상관함수
2.5.
(ACF)
(PACF)
.
(IACF)
,
(
, 1994)
(PACF)
. R
(ACF)
R script
R script 5
.
(ACF)
(PACF)
acf(diff(lnzt), 48); pacf(diff(lnzt), 48)
acf(diff(diff(lnzt), 4), 48); pacf(diff(diff(lnzt), 4), 48)
Figure 2.2. PACF for ARIMA(p,d,q)
Figure 2.1. ACF for ARIMA(p,d,q)
및
에서는 와 는 그래프와 함께 각 시차에 따르는 상관계수 및 편
상관계수도 함께 출력된다 에서 시차에 따르는 상관계수 및 편상관계수의 출력은 좌우 괄호를
추가하여 이를테면
을 시행하면 각 시차에 따르는 상관계수가 출력된다 시계열
자료에 대한 자기상관함수 와 편자기상관함수 에 대한 각 패키지별
를 요약 정
리하면
와 같다
2.6. 모형의 적합
모형 식별의 결과로부터 모형의 적합 모수추정 을 위한
는
함수를 이용하여 구할
수 있으며 대수변환된 시계열이   로 식별된 경우 모형의 적합을 위한
는 다음과 같다
《
》 모형의 적합을 위한
SAS, SPSS
MINITAB
ACF
PACF
. R
, (acf(diff(lnzt), 48))
.
(ACF)
Table 5
(PACF)
key word
.
(
)
R script

.
R Script 6
R script
arima( lnzt, order=c(0,1,0), seasonal=list(order=c(1,1,1), period=4),
nclude.mean = TRUE, method = c("CSS-ML", "ML", "CSS"))
arima()
R script
김희재
336
Table 5. ACF and PACF
Package
ACF and PACF
R
acf(diff(diff(lnzt), 4), 48); pacf(diff(diff(lnzt), 4), 48)
SAS
proc arima; identify var=lnyt(1,4) nlag=48;
SPSS
acf vars=dif121.lnzt/pacf. or acf vars=zt/diff=1/sdiff=1/ln.
MINITAB
acf 48 c4 and pacf 48 c4
에서는
함수의 출력 결과로부터 일반 및 계절 요인에 대한 계수와 이들의 표준오차 그
리고 대수변환된 시계열에 대한 분산과 대수우도
및 통계량 값을 구할 수 있다
또한
함수에 사용된 옵션의 의미는 에서 도움말을 참조하면 가능하며 추정방법이 인
경우는 최대가능도법 이 적용된다 모형식별 통계량으로 에서는 이외에 통계량
에서는 통계량 등을 추가로 더 구할 수 있다 모형의 적합에 대한 패키지별
를
요약 정리하면
과 같다
R
arima()
(log likelihood)
arima()
(ML)
SPSS
AIC
.
R
default
.
SAS
BIC
AIC
SBS
.
Table 6
,
key word
.
Table 6. Model Estimation
Package
Model Estimation
R
arima( lnzt, order=c(0,1,0), seasonal=list(order=c(1,1,1), period=4)
SAS
proc arima; identify var=lnzt(1, 4); estimate p=(4) q=(4);
SPSS
arima variables = zt /model = (0,1,0) (1,1,1) noconstant ln.
MINITAB
arima (0,1,0)*(1,1,1) 4 'lnzt' resid c6 fitted c7
모형의 진단
추정된 시계열 모형에 대한 적합도 검정은 잔차들의 백색잡음과정에 대한 검정으로 잔차들의
모든 표본자기상관계수
를 이용하는 포트맨토
검정과 와
의  통계량 등을 이용한 검정 그리고 과
의 수정된  통계량을 이용한 검정 등
을 들 수 있다 패키지에서는
함수를 사용하여 추정된 시계열 모형에 대한 적합도 검정이
가능하며 이에 대한 수행은
과 같이 작성될 수 있으며 이를 실행한 경우의 그래프 출력
결과는
과 같다
《
》 모형의 진단 위한
와 출력 결과의 예
2.7.
(residual SACF)
(Portmanteau)

Ljung
. R
Box
Pierce(1970)

Box(1978)
tsdiag()
,
R script 7
Figure 3
,
.
R script 7
R script
tsdiag(zt.fit, gof.lag=48)
와 에서는 모형의 추정을 위한 명령문의 실행시에 포트맨토
의 잔차에 대한
자기상관 검정
과 잔차진단이 포함 되어 출력되며
에서는
모형 적합후의 잔차에 대하여 와 를 실행함으로써 잔차진단의 통계량인 수정된
 통계량을 구할 수 있다
SAS
SPSS
(Portmanteau)
(autocorrelation check of residuals)
ACF
Pierce (Ljung-Box)

, MINITAB
PACF
Box-
(Table 7).
Table 7. Model Diagnostics
Package
R
Model Diagnostics
tsdiag(zt.fit, gof.lag=48)
SAS
proc arima; identify var=lnzt(1, 4); estimate p=(4) q=(4);
SPSS
arima variables=zt /model=(0,1,0) (1,1,1) noconstant ln.
MINITAB
arima (0,1,0)*(1,1,1) 4 'lnzt' resid c6, acf 36 c6, pacf 36 c6
시계열분석에 대한 R 패키지의 활용
337
Figure 3. Diagnastic Display for the ARIMA(p,d,q) Model
예측값 및 예측의 적합척도
시계열분석에서 예측은 예측오차
가 작을수록 예측이 정확하게 이루어졌다고 볼 수
있다 일반적으로는 바람직한 예측값을 구하는 방법은 여러 가지가 있으나 평균제곱오차 를
최소로 하는 값을 예측값으로 흔히 사용한다
예측의 정도를 평가하는 척도는 평균제곱오차
제곱근 평균제곱오차
퍼센트오차
평균 퍼센트오차
평균 절대퍼센트오차
그리고 평균절대오차
등이 있을
수 있으나 일반적으로는
또는
를 흔히 사용한다 대수변환된 시계열 가
  로 식별된 경우 예측값 및 예측오차를 구하는
프로그램은
과같
이 작성될 수 있으며 예측의 적합척도는 각 척도의 정의에 따르는 간단한 연산에 의하여 쉽게 구
할 수 있다
《
》 예측값과 예측오차를 구하는
2.8.
(forecast error)
.
(MSE)
.
(MSE),
(PE),
(MPE),
,
(RMSE),
(MAPE)
RMSE
MAPE
(MAE)
.
zt
R

R Script 8
,
.
R script 8
R script
( lnzt.fit <-arima( lnzt, order=c(0,1,0), seasonal=list(order=c(1,1,1), period=4),
include.mean = TRUE, method = c("CSS-ML", "ML", "CSS")) )
( lnzt.pr <- predict(lnzt.fit, n.ahead=8) )
( pred <- exp(lnzt.pr$pred) )
( se <- exp(lnzt.pr$se) )
에서는
안에서
문과
문이 선행된 후에
문을 사용하며
에서는
명령문의 부명령문으로서
문을 사용한다 특히 에서는
명
령문의 사용이전에
문이 선행되어야 가능하다 각 패키지별 예측값과 예측오차를 구하는
를 요약정리하면
과 같다
SAS
MINITAB
arima procedure
identify
arima
predict
key word
estimate
forecast
Table 8
.
.
forecast
.
SPSS
,
arima
김희재
338
Table 8. Predictions and Prediction Error
Package
Predictions and Prediction Error
R
predict(lnzt.fit, n.ahead=8)
SAS
proc arima; identify var=lnzt(1, 4);
estimate p=(4) q=(4); forecast lead=8 out=lnzt_out
SPSS
predict thru year 2008 quarter 2.
arima variables = zt /model = (0,1,0) (1,1,1) noconstant ln.
MINITAB
arima (1,1,1)*(0,1,1) 4 'lnzt'; forecast 12, save in c10 c11 c12.
3. R
패키지를 활용하는 사례연구
년 사분기부터 년 사분기까지의 우리나라의 국내총생산 분기별 시계열자료 단위
는 억 를 년 사분기까지의 시계열자료를 사용하여 승법계절
모형을 구축하고 이를
이용하여 년 사분기부터 년 사분기의 예측값과 적합척도를 구하기 위한 프로그램은
와 같이 작성될 수 있다 단 국내총생산 분기별 자료는 통계청 홈페이지에서 쉽게
구할 수 있다
《
》 자료의 시계열분석을 위한
원시 시계열 시계열 그래프
1970
10
1
)
2010
2008
2008
2
(GDP)
2
3
ARIMA
2010
R script 9
.
2
,
GDP
#
(GDP)
R script
&
gdp <- scan("e:/gdp.txt")
(gdp.ts <- ts(gdp, start=c(1970, 1), frequency=4)); plot.ts(gdp.ts)
#
모형구축용 시계열
(zt <- window(gdp.ts, c(1970, 1), c(2008,2)))
#
분산과 추세 및 계절추세의 안정화
lnzt <- log(zt); dif1.lnzt <- diff(lnzt); plot.ts(dif1.lnzt)
dif41.lnzt <- diff(dif1.lnzt, differences=4)
#
모형의 식별
acf(diff(lnzt), 32); pacf(diff(lnzt), 32)
acf(diff(diff(lnzt), 4), 32); pacf(diff(diff(lnzt), 4), 32)
#
모형의 적합과 결과 및 진단
(lnzt.fit <- arima( lnzt, order=c(0,1,0), seasonal=list(order=c(1,1,1), period=4)) )
tsdiag(lnzt.fit, gof.lag=32)
#
예측 및 예측의 적합측도
(lngdp.pr <- predict(lnzt.fit, n.ahead=8))
(pred <- exp(lngdp.pr$pred))
(p.err <- pred-actual); sse=p.err^2; mse=mean(sse); rmse=sqrt(mean(sse));
pe=(p.err/actual)*100 ; mpe=mean(pe); ape=(abs(pe)); mape=mean(ape)
cat("RMSE= ", rmse, "MAPE=", mape, "\n")
#
,
R
.
R script 9
(
실제값 및 예측값 시계열 그래프
actual <- gdp[155:162]; quarter = 98:154 ; quarter1=155:162
시계열분석에 대한 R 패키지의 활용
339
legends <- c("o = predict value", " - = real value")
plot(quarter, zt[98:154], type="l", ylim=c(50000, 330000),
xlim=c(98, 162), ylab="Gdp in Korea")
legend(100, 300000, legend=legends )
우리나라 분기별
title(main="
단위 억
GDP,
10
, 1970.1-2010.2")
lines(quarter1, pred, col="black", type="o")
lines(quarter1, actual, col="black", lty="dashed")
abline(v=154.5, lty="dotted")
《
첫째
》의 실행결과 가운데 핵심부분을 요약 정리하면 다음과 같다
자료에 적합된 승법계절
모형
R script 9
.
: GDP
ARIMA


         lngdp     ,
 ∼   
둘째 대수우도 및
:
AIC
(2.2)
   .
식별 통계량
log likelihood = 325.18, aic = -644.36
(2.3)
셋째 예측의 적합척도
:
 

   
  = 17348.19,




(2.4.1)



   
       ×  = 6.18247.
넷째
년 분기에서
: 2008
3
분기별
(2.4.2)
년 분기까지의 예측값과 예측오차
2010
2
Table 9. GDP in Korea, 1970.1-2010.2, billion Won
실제값
(Time)
예측값
예측오차
(Real)
(Predictions)
(Prediction Error)
2008.3
262615
267851.9
5236.857
2008.4
261318
284168.9
22850.906
2009.1
237855
261019.6
23164.594
2009.2
264414
281701.9
17287.865
2009.3
275367
288497.2
13130.204
2009.4
285424
306337.2
20913.189
2010.1
265624
281250.8
15626.788
2010.2
290817
303803.9
12986.882
다섯째 년 분기에서 년 분기까지의 실제값과 예측값의 시계열 그래프
본 연구에서는 시계열자료에 대한 분석을 상용되는 패키지인
을 사용하지
않고 무료 공개 소프트웨어인 패키지를 활용하여
모형 및 승법계절
모형에 대
한 분석이 가능함을 사례연구를 통하여 분석 및 예측이 가능함을 보였다
시계열자료에 대한 기타의 모형 특히 경제시계열모형에서 자주 언급되는 자기회귀 시차분포모
: 2008
3
2010
2
(Figure 4)
SAS, SPSS, MINITAB
,
R
ARIMA
ARIMA
.
김희재
340
형 모형 자기회귀 조건부 이분산 모형
및
모형 오차수정모형 등과 시계열
분석에서 다루는 기타의 분야에도 패키지의 활용이 더욱 연구되어야 할 과제로 사료된다
(ADL
),
(ARCH
GARCH
),
R
.
Figure 4. GDP in Korea, 1970.1-2010.2, Unit: a billion Won
참고문헌
김수화 김승희 조신섭
통계패키지에서의 시계열 분석방법의 비교연구 한국통계학회논문집
김연형 정영숙
주택가격과 거시경제 변수간의 시계열분석 Journal of the Korean Data Analysis Society,
김희재
샘플링 검사에 대한 시스템의 활용에 관한 고찰 Journal of the Korean Data Analysis Society,
김희재
을 이용한
수명분포의 모수추정 경성대학교기초과학 연구소 기초과학연구논문집,
엄철준 오갑진 박종원
금융시계열의 상관행렬 속성분해를 위한 새로운 방법연구 Journal of the
Korean Data Analysis Society
전새봄 최보승 김성용
스펙트럼 분석을 이용한 시계열 자료의 패턴 분류 Journal of the Korean Data
,
,
(1994).
,
, 1(1),
119-130.
,
(2006).
,
8(6), 2383-2398.
(2003).
R
,
5(3), 601-616.
(2005). R
Weibull
,
,
17,
21-30.
,
,
(2007).
,
, 9(4), 1833-1848.
,
,
(2009).
,
Analysis Society, 11(1B), 349-359.
Box, G. E. P. and Pierce, D. A. (1970). Distribution of residual autocorrelation on auto-regressive integrated moving
average time series models, Journal of the American Statistical Associations, 65, 1509-1526.
Ljung, G. M. and Box, G. E. P. (1978). On a measure of lack of fit in time series models, Biometrika, 65,
297-303.
시계열분석에 대한 R 패키지의 활용
341
The Application of Time Series Analysis
*
under R Environment
1
Hee Jae Kim 2)
Abstract
The statistical package SAS, SPSS and MINITAB are commonly used on time series
analysis and prediction but they are very expensive. In this study, the multivariate seasonal
ARIMA model is fitted and predict values are obtained for the Gross Domestic Product
(GDP) of South Korea from 1970 Q2 to 2010 Q2 by taking advantage of the free R
package. In addition, the aim of this study is to broaden the choice of packages and to
contribute
to
the
research
and
development
of
time
series
analysis
by
providing
a
comparison chart of key word and option according to analysis module among the above
packages.
Keywords : time series analysis, R package, ARIMA model, multivariate seasonal
ARIMA model, GDP of South Korea.
*
This research was supported by 2010 Research Grant of Kyungsung University.
1
Professor, Department of Informational Statistics, Kyungsung University, Busan 608-736, Korea.
E-mail : [email protected]
[Received 23 December 2010; Revised 23 January 2011; Accepted 26 January 2011]