본문 바로가기

데이터과학/statistics

예측방법론 - 상관도표, 부분상관도표

2000년 1월 ~ 2012년 12월 실업률의 원계열과 계절조정계열에 대한 다음 물음에 답하시오.

문제4) 월별 실업률 계절조정계열에 대한 상관도표, 부분상관도표를 구하고 그 특징을 서술하시오. (10점)


문제의도) 원계열은 문제에서 제외하고, 계절조정계열에 대해서만 물어 본다는 것이 상관도표를 분석하는 데에 있어 원계열을 그대로 분석하기 보다 계절적 요인이 제거된 상태에서 분석을 하는 것을 의도한 것이라 판단되며, 실업률의 경우 전반적으로 떨어지는 추세에 있으므로, 상관도표의 경우 다소 하락추세를 보이면서 상관성을 보일 것이고, 부분상관의 경우도 튀는 경우가 있을 것으로 예상.




1차결과분석)
 원계열은 왜 제시하지 않았는지를 잘 보여주고 있는 점은 3차까지 상관관계가 있음을 잘 보여줌으로써 계절적 요인이 제거되지 않았음을 볼 수 있다. 그리고 계절조정계열의 경우에도 차분하지 않았기 때문에 추세의 경향을 보이고 있다. 다시 변수변환(diff)을 통해 수행하였으며 지수적으로 증가/감소하는 경향은 없으므로 로그변환(log)은 수행하지 않았다. (실제로 해 보았을 때에도 큰 차이는 보이지 않았다.)


1차결과코드)

par(family="AppleGothic", mfrow=c(2,2))
ylimits <- c(-0.3, 1.0)
acf(ur_, ylim=ylimits, main="실업률 (원계열) 상관도표")
pacf(ur_, ylim=ylimits, main="실업률 (원계열) 부분상관도표")
acf(ur_sa_, ylim=ylimits, main="실업률 (계절조정계열) 상관도표")
pacf(ur_sa_, ylim=ylimits, main="실업률 (계절조정계열) 부분상관도표")



2차결과분석)
예상대로 상관도표 및 부분상관도표에서 계절적요인과 추세가 사라진 것으로 보았다. 다만 5차에서 살짝 5%를 넘어서고 있으므로 4차 데이터까지만 사용할 수 있다고 판단된다. 그래서 다음 실험으로 Box-test를 통해 륭(Ljung)과 박스(Box)의 검정(portmanteau 검정)을 통해 검토하기로 한다. 


2차결과코드)

par(mfrow=c(2,1))
ylimits <- c(-0.3, 1.0)
acf(diff(ur_sa_), ylim=ylimits)
pacf(diff(ur_sa_), ylim=ylimits)



Box-Ljung test
data:  diff(ur_sa_) 
X-squared = 3.1996, df = 3, p-value = 0.3619

Box-Ljung test
data:  diff(ur_sa_) 
X-squared = 16.8069, df = 4, p-value = 0.002107


3차결과분석)
자유도를 3으로 두었을 때에는 예상대로 유의수준 5%에서 0과 다르다고 할 수 없으며 귀무가설을 기각할 수 없다. 다만, 자유도 4이상에서는 자기상관계수는 0과 다르다는 
귀무가설을 기각할 수 있고, 유의 수준에서 0과 다르다고 할 수 있어서 5차 이후는 상관관계가 존재한다고 말할 수 있겠다.


3차결과코드) 
Box.test(diff(ur_sa_), lag=3, type="Ljung");
Box.test(diff(ur_sa_), lag=4, type="Ljung");



 

'데이터과학 > statistics' 카테고리의 다른 글

예측방법론 - 스펙트럼  (0) 2013.03.26
예측방법론 - 시계열도표  (0) 2013.03.26
예측방법론 - 고용률, 실업률  (0) 2013.03.25