Rex 분석 : 2단계최소제곱

  1. 분석모듈 설명
  2. 2단계 최소제곱은 종속변수(dependent variable)의 오차항이 설명변수(explanatory variable)와 독립이 아닐 때, 종속변수의 오차항과 독립관계인 도구변수(instrumental variable)를 활용하여 2단계에 걸쳐 선형회귀분석을 수행할 수 있는 통계분석 모듈입니다. 선형회귀분석의 중요한 가정 중 하나인 오차항과 설명변수 사이의 독립성이 위반된 경우 최적의 모수 추정치를 구할 수 없는데, 이를 보완하기 위하여 오차항과 상관관계가 없는 도구변수를 사용합니다. 종속변수와 설명변수, 도구변수를 적절히 지정해주면 첫 번째 단계에서 설명변수를 종속변수로 두고 도구변수를 설명변수로 두어 선형회귀분석을 실시하고, 두 번째 단계에서 설명변수를 첫 번째 단계에서 얻어진 적합값(fitted value)으로 대체하여 종속변수와의 선형회귀분석을 실시하게 되는데, 이를 통해 최적의 모수 추정치를 계산할 수 있습니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * AER 패키지의 ivreg 함수
  5. User interface: 변수설정 탭
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 종속변수
    • - 종속변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 필수로 한 개의 변수가 선택되어야 하며 양적변수(quantitative variable)만 가능합니다.
    • 질적변수, 양적변수
    • - 설명변수와 도구변수에 포함될 변수들의 유형을 지정해줍니다. - 종속변수와 중복되어 선택될 수 없습니다. - 질적변수(qualitative variable)와 양적변수는 서로 중복되어 선택될 수 없습니다. - 질적변수로 선택된 변수들은 문자로 인식되어 분석에 사용됩니다. - 문자형변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다. - 한 개 이상의 변수를 입력할 수 있지만 변수를 선택하지 않아도 분석을 실시할 수 있습니다.
    • 최종모형
    • - 오른쪽 상단의 콤보박스를 클릭하여 설명변수와 도구변수를 설정할 수 있습니다. - 질적변수 혹은 양적변수로 정의된 변수들 중 분석에 포함할 변수를 선택할 수 있는데, 여러 변수를 중복 선택하여 주효과 버튼을 클릭하면 최종모형에 주효과들이 포함되고, 교호작용 버튼을 클릭하면 선택된 변수들의 교호작용이 최종모형에 포함됩니다. - 이 때 설명변수의 수가 도구변수의 수보다 많은 경우 오류가 발생하오니 주의하십시오. - 모든 효과들은 설명변수와 도구변수에 중복되어 선택될 수 있습니다. - 설명변수와 도구변수로 선택된 변수에서 결측치를 포함하는 관측치(observation)는 분석에서 제외됩니다.
    • 상수항 포함하지 않음
    • - 2단계 최소제곱의 첫 번째, 두 번째 단계의 선형회귀분석에 상수항(intercept)을 포함하지 않으려면 이 옵션을 선택하십시오. - 만약 설명변수와 도구변수로 아무런 변수가 선택되지 않았을 때는 이 옵션을 선택할 수 없습니다.
  6. User interface: 출력옵션 탭
    • 회귀계수
    • - 결과출력창의 회귀계수 부분에 신뢰구간(confidence interval)을 함께 출력하려면 신뢰구간 옵션을 선택하십시오. - 이 때 0 과 1 사이의 값을 지정하여 신뢰수준을 결정할 수 있습니다.
    • ANOVA Table: 결과출력창에 분산분석표를 포함하려면 이 옵션을 선택하십시오.
    • 적합값: 적합값을 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: Fitted_TSLS)
    • 잔차: 잔차(residual)를 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: Resid_TSLS)
    • 표준화잔차: 표준화잔차(standardized residual)를 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: stdResid_TSLS)
  7. 결과출력창 해석
    •  	
    • Data Structure: 전체 관측치 수(the number of observations), 전체변수의 수(the number of variables), 분석에 사용된 변수의 수(the number of used variables)를 나타냅니다.
    • Variable List
    • - 질적변수와 양적변수로 선택된 변수들 중 분석에 사용된 변수를 나타냅니다. - 질적변수로 포함된 변수는 무조건 문자형변수로 변환되어 분석에 사용됩니다. - 문자형변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다.
    • Analysis Description: 종속변수, 설명변수, 도구변수와 상수항 포함여부(intercept included)를 나타냅니다.
    • Coefficients
    • - 설명변수의 모수 추정치를 나타냅니다. - 상수항만 포함된 모형의 경우 모수 추정치만을 제공합니다.
    • ANOVA Table
    • - 분산분석표를 출력합니다. - 상수항이 없는 모형의 경우 분산분석표를 지원하지 않습니다. - 상수항만 포함된 모형의 경우 분산분석표를 지원하지 않습니다.
  8. Warning 메세지
  9. * 종속변수가 양적변수가 아닌 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: Dependent variable should be numeric. Analysis has been stopped.)
    * 상수항을 포함하지 않는 모형이 아무런 설명변수도 포함하지 않으면 아래의 메시지와 함께 분석이 종료됩니다 (Error: With no intercept, at least 1 explanatory variable should be selected. Analysis has been stopped.)
    * 설명변수의 수가 도구변수의 수보다 많은 경우, 아래의 메시지와 함께 분석이 종료됩니다 (Error: The number of explanatory variables should be less than that of instruments.)