Rex 분석 : ARIMA모형

  1. 분석모듈 설명
  2. ARIMA 모형은 직접 AR, 차분, MA 차수를 결정하거나 자동으로 추정하여 시계열 자료에ARIMA 모형을 적합 시키는 분석모듈입니다. ARIMA 모형은 AR, I, MA로 구성되어 있습니다. AR은 자기회귀(autoregression)부분으로써 현재의 값이 과거의 관측치(observations)로 회귀되었음을 의미하고 I는 시계열 자료의 차분 횟수를 의미합니다. 마지막으로 MA는 과거 오차의 선형결합을 나타냅니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * forecast 패키지의 Arima, auto.arima, accuracy, tsdiag, forecast 함수
  5. User interface: 변수설정 탭
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 시계열변수
    • - 전체변수로부터 시계열변수(time series variable)에 해당하는 변수를 선택할 수 있습니다. - 한 개의 변수가 필수로 선택되어야 하며 양적변수만 가능합니다.
    • 설명변수
    • - 전체변수로부터 설명변수(explanatory variable)에 해당하는 변수를 선택할 수 있습니다. - 양적변수만 가능하며 한 개 이상의 변수를 선택할 수 있지만 선택을 하지 않아도 분석을 실시할 수 있습니다.
  6. User interface: 분석옵션 탭
    • 계절형 자료
    • - 시계열변수가 계절형 자료일 때 이 옵션을 선택하십시오. - 계절길이는 2 이상의 정수를 입력하십시오.
    • 차수
    • - ARIMA 모형의 비계절(AR, 차분, MA), 계절(AR, 차분, MA) 차수를 직접 입력하여 사용할 수 있습니다. - ARIMA 모형의 차수를 자동으로 추정하여 사용하려면 비계절 및 계절 차수 자동 선택 옵션을 선택하십시오.
    • 절편포함: ARIMA 모형을 적합할 때 절편을 포함하려면 이 옵션을 선택하십시오.
    • 1차 추세 포함: ARIMA 모형을 적합할 때 1차 추세를 포함하려면 이 옵션을 선택하십시오.
    • Box-Cox 변환
    • - Box-Cox 변환을 한 시계열변수를 사용사여 ARIMA 모형을 적합 하려면 이 옵션을 선택하십시오. - lambda를 사용자가 설정할 수 있습니다.
    • ARIMA 옵션 요약: 분석옵션 탭에서 지정한 옵션들을 요약해서 나타냅니다.
  7. User interface: 출력옵션 탭
    • (출력) 시계열 그래프: 결과출력창에 시계열 그래프(time series plot)를 포함하려면 이 옵션을 선택하십시오.
    • (출력) 잔차진단 그래프: 결과출력창에 잔차(residual)진단과 관련된 표준화 잔차(standardized residuals) 그래프, 잔차의 ACF 그래프, 잔차의 백색잡음 검정(Ljung-Box Test)결과 그래프를 포함하려면 이 옵션을 선택하십시오.
    • (출력) 예측값
    • - 적합한 모형을 사용하여 예측값(point forecast)을 계산하려면 이 옵션을 선택하십시오. - 예측값 옵션을 선택한 경우 예측시차는 1 이상의 정수를, 신뢰수준(confidence level)은 0 과 1 사이의 값을 입력하십시오. - 결과출력창에 예측 그래프를 포함하려면 예측 그래프 옵션을 선택하십시오.
    • (저장) 적합값: 적합값(fitted value)을 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: Fitted_ets)
    • (저장) 잔차: 잔차를 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: Resid_ets)
  8. 결과출력창 해석
    •  	
    • Data Structure: 전체 관측치 수(the number of observations), 계절길이(seasonal period)를 나타냅니다.
    • Analysis Description: 분석방법(methods), 변수 이름(variable name), Box-Cox 변환(Box-Cox transformation)을 나타냅니다.
    • Estimates of ARIMA Parameters: ARIMA 모수 추정치를 나타냅니다.
    • Goodness of Fit Measures: 시계열 모형의 AIC, AICc, BIC를 나타냅니다.
    • Training Set Accuracy Measures: 시계열 모형의 정확성의 척도를 나타냅니다. 각 척도의 정의는 아래와 같습니다.
    • ME
      RMSE
      MAE
      MPE
      MAPE
      MASE  (시계열변수가 계절형 자료가 아닐 때) (시계열변수가 계절형 자료 일 때)
    • Time Series Plot: 시계열 그래프를 나타냅니다.
    • Diagnostic Plots: 시계열 모형의 잔차진단 그래프를 나타냅니다.
    • Forecast Intervals: 시계열 모형의 예측시차까지의 예측값과 신뢰구간(confidence interval)을 나타냅니다.
    • Forecast Plot
    • - 시계열 모형의 예측값 그래프를 나타냅니다. - 원 시계열변수는 검은색, 예측 시계열은 파란색, 신뢰구간은 회색음영으로 나타납니다.
  9. Warning 메세지
  10. * 시계열변수가 양적변수가 아닌 경우 아래의 메시지와 함께 분석이 종료됩니다. (Error: Time series variable should be numeric. Analysis has been stopped.)
    * 시계열변수에 결측치가 존재할 경우 아래의 메시지와 함께 분석이 종료됩니다. (Error: Missing values encountered in Time series variable. Analysis has been stopped.)
    * Box-Cox 변환의 lambda가 0보다 작은 변환을 실시하여 시계열변수에 0보다 작은 값이 있는 경우 아래의 메시지와 함께 분석이 종료됩니다.
    (Error: Inappropriate transformation for data with negative or zero values. Analysis has been stopped.)
    * 모수의 값이 제한된 범위를 벗어날 경우 아래의 메시지와 함께 분석이 종료됩니다.
    (Error: Parameters out of range. Analysis has been stopped.)