ARIMA 모형 (계절형) – 시계열분석

ARIMA 모형 (계절형)

ARIMA 모형을 보기전에 먼저 계절성을 가지는 데이터로 우리나라의 실업률의 데이터로 그래프를 보면 아래와 같은 형태로 나온다.

그래프를 분석하면 트렌드를 가지고 있고 분산이 동일하지 않고, 계절적인 형태가 보인다.

– 분산 안정화

$-z_{t}^{-\frac{1}{2}}$

– 추세제거

$\nabla -z_{t}^{-\frac{1}{2}}$

분산 안정화 작업과 추세제거를 하여 정상 시계열형태로 변환하였다. 해당데이터를 이용하여 ARIMA 나머지 정보를 확인한다.

계절형 시계열을 위한 차분

– s 차 계절차분

$\nabla_{s}Z_{t} = Z_{t} – Z_{t-s}$ 로 위 데이터를 봤을 때  매년 1월에 데이터가 증가 하는 현상이 있고 12개월 주기라고 생각하면 된다.  즉 12개월 주기로 차분을 진행하면 된다.

– 계절차분에 의한 비정상성 시계열의 정상화

$\nabla_{12}\nabla -Z_{t}^{-\dfrac{1}{2}} = \nabla_{12}(-Z_{t}^{-1\dfrac{1}{2}} – (-Z_{t-1}^{-\dfrac{1}{2}})) = -Z_{t}^{-\dfrac{1}{2}} + Z_{t-1}^{-\dfrac{1}{2}} + Z_{t-12}^{-\dfrac{1}{2}} – Z_{t-13}^{-\dfrac{1}{2}}$ 으로 비정상성 시계열을 정상화 했다.

위 데이터를 보면 계절성이 없어진것이 보인다.

이 정보를 가지고 ARIMA 모형에 fitting 하면 된다.

계절형 ARIMA 모형

– D 차 계절 차분된 ARIMA 모형

$\Phi(B^{s})\nabla_{s}^{D}Z_{t} = \Theta(B^{s})\alpha_{t}$ 로 표현 한다.

$\Phi(B^{s}) = 1 – \Phi_{1}B^{s} – \Phi_{2}B^{2s} – \cdot \cdot \cdot – \Phi_{p}B^{Ps}$

$\Theta(B^{s}) = 1 – \Theta_{1}B^{s} – \Theta_{2}B^{2s} – \cdot \cdot \cdot – \Theta_{p}B^{Ps}$

– 모형 식별 단계

변수변환을 통한 분산 안정화 수행

추제제거를 위한 차분 수행 : 추세가 제거된 계열을 이용하여 ACF, PACF를 통하여 계절성 여부를 확인 후, 계절성이 존재하면 추가적인 계절차분을 수행한다. 시도표, ACF, PACF를 통하여 정상성 여부를 판단한다.

정상 시계열의 ACF, PACF 를 이용하여 ARIMA모형의 계절형, 비계절형 AR,MA 차수 결정을 한다. 계절형 차수 결정은 계절주기 S의 배수에 해당하는 시차만을 가지고 계절차수를 결정하고, 차수 결정 방법은 비계절형 방법과 동일하다. 비계절형 차수 결정은 ACF, PACF 의 s/2 시차까지를 고려하여 비계절형 차수를 결정한다.

ACF, PACF 를 비교할 때 계절성(예를 들어 12개월) 을 주기로 비교 해야 한다.  아래와 같은 ACF 그래프에서 12개월, 24 개월을 비교 한다. MA(1) 이라고 판단할 수 있다.

계절형 ARIMA 모형의 추정

CLS, ULS, ML 등의 방법을 사용하여 모형 추정 가능

$ARIMA(0,1,1) \times (0,1,1)_{12}$ 모형의 추정치를 보면 아래와 같다 상수항의 추정치가 작은걸로 보인다.

상수항을 제거한 추정치를 보면 아래와 같다.

$nabal_{12}\nabla X_{t} = (1-0.3B)(1-0.605B^{12})a_{t}$ 으로

$X_{t} = X_{t-1} + X_{t-12} – X_{t-13} + a_{t} – 0.3a_{t-1}-0.605a_{t-12}+0.1815a_{t-13}$으로 표현할 수 있다.

ARIMA 모형 검진

최종적으로 잔차분석을 통해 모델을 확인을 한다.

적합 잔차의 ACF 와 PACF 확을 하고 모든 값이 $\dfrac{2}{\sqrt{n}}$ 보다 작아야 한다.

포드만토 통계량(portmanteau statistic)

$Q = n(n+2)\sum_{k=1}^{K}\dfrac{r^{2}_{k}}{n-k} \ ~ \ \chi^{2} \ \ \ (K-p-q-P-Q)$

ARIMA 모형의 예측

– 적합식

$X_{t} = X_{t-1} + X_{t-12} – X_{t-13} + a_{t} – 0.3a_{t-1}-0.605a_{t-12}+0.1815a_{t-13}$

– $X_{t+s}$ 의 예측치

$\hat{X}_{t+s|t}=E(x_{t+s}|x_{t},x_{t-1},\cdot \cdot)$

계절형 ARIMA 모형의 식별

– 로그 우도 함수

$log L(\phi, \mu, \theta, \sigma^{2}) = -\dfrac{T}{2}log2\pi\sigma^{2} – \dfrac{\sum_{t=1}^{T}[E(a_{t}|\phi,\mu,\theta,\z)]^{2}}{2\sigma^{2}}$

– AIC

AIC = -2(최대로그우도) + 2(적합모수의 수)

– SBC

SBC = -2(최대로그우도) + (적합모수의 수)log(n), $n = T-d-D_{s}$

 

참고자료 : Forecasting: Principles and Practice

답글 남기기