Rex 분석 : 다변량선형회귀

  1. 분석모듈 설명
  2. 다변량 선형회귀분석은 종속변수(dependent variable)가 다변량 정규분포(multivariate normal distribution)를 따른다고 가정할 때 선형회귀분석을 수행하는 통계분석 모듈입니다. 종속변수가 여러 개 있을 때, 회귀분석 중 가장 단순한 형태인 일변량 선형회귀분석의 경우 각각의 종속변수에 대하여 개별적으로 선형 회귀모형을 적합하는 반면, 다변량 선형회귀분석에서는 여러 종속변수를 하나의 벡터로 표시하여 선형 회귀모형에 적합합니다. 일변량 선형회귀분석과 마찬가지로 다변량 선형회귀분석에서도 각각의 종속변수가 정규분포를 따른다고 가정하지만, 특수한 상관관계가 있는 등 각 종속변수를 개별적으로 고려하는 것이 어려울 경우 다변량 선형회귀분석을 사용하는 것이 바람직합니다. 다변량 선형회귀분석은 다변량 분산분석(Multivariate ANOVA, MANOVA)이라는 방법을 사용하는데, 일반적인 분산분석(ANOVA)과 마찬가지로 제곱합(sum of squares)을 비교하여 검정하는 형태를 가지고 있습니다. 그런데 다변량 선형회귀분석에서는 종속변수가 하나의 값이 아닌 벡터이므로 제곱합이 행렬의 형태로 나타나게 되고, 따라서 일반적인 분산분석의 F 통계량이 아닌, Pillai-Bartlett trace나 Wilks’ lambda와 같은 다른 통계량을 사용하여 분석합니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * car 패키지의 scatterplotMatrix 함수
    * car 패키지의 Manova 함수
    * car 패키지의 Anova.mlm 함수
    * Matrix 패키지의 rankMatrix 함수
  5. User interface: 변수설정 탭
    • 
       	
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 종속변수
    • - 종속변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 반드시 두 개 이상의 양적변수(quantitative variable)가 선택되어야 합니다.
    • 질적변수, 양적변수
    • - 설명변수에 포함될 변수들의 유형을 지정해줍니다. - 종속변수와 중복되어 선택될 수 없습니다. - 질적변수(qualitative variable)와 양적변수는 서로 중복되어 선택될 수 없습니다. - 질적변수로 선택된 변수들은 문자로 인식되어 분석에 사용됩니다. - 문자형변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다. - 적어도 하나의 설명변수를 선택해야 합니다.
    • 최종모형
    • - 질적변수 혹은 양적변수로 정의된 변수들 중 분석에 포함할 변수를 선택할 수 있는데, 여러 변수를 중복 선택하여 주효과 버튼을 클릭하면 최종모형에 주효과들이 포함되고, 교호작용 버튼을 클릭하면 선택된 변수들의 교호작용이 최종모형에 포함됩니다. - 설명변수로 선택된 변수에서 결측치를 포함하는 관측치(observation)는 분석에서 제외됩니다.
    • 상수항 포함하지 않음: 상수항을 포함하지 않으려면 이 옵션을 선택하십시오.
  6. User interface: 변수설정 탭
    • 제곱합 유형
    • - 분산분석표에서 각 변수에 해당하는 통계량의 유형을 선택할 수 있습니다. - Type I부터 III까지 선택할 수 있으며, 기본값은 type I입니다.
    • 통계량
    • - 분산분석표에 표시할 검정통계량의 종류를 선택할 수 있습니다. - 사용 가능한 통계량은 아래와 같습니다: Pillai-Bartlett trace(Pillai), Hotelling-Lawley’s trace(Hotelling-Lawley), Wilks’ lambda(Wilks), Roy’s largest root(Roy)
  7. 결과출력창 해석
    •  	
    • Data Structure: 전체 관측치 수(the number of observations), 전체변수의 수(the number of variables)를 나타냅니다.
    • Variable List: 종속변수와 설명변수인 양적변수와 질적변수를 표시합니다.
    • Analysis Description: 분석에 사용된 모형, 검정통계량, 통계량 유형을 표시합니다.
    • Scatter Plot Matrix
    • - 분석에 사용된 양적 종속변수와 설명변수의 산점도 행렬을 표시합니다. - 질적변수가 있는 경우, 각 산점도에서 질적변수의 범주마다 point와 data-concentration ellipse의 색, 모양 등을 다르게 표시합니다.
    • Coefficient Estimates: 회귀계수의 추정치를 나타냅니다.
    • Multivariate ANOVA Table with Type I/II/III SS: 다변량 분산분석표(multivariate ANOVA table)를 표시합니다.
  8. Warning 메세지
  9. * 종속변수가 선택되지 않았거나 하나만 선택되었을 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: Please select more than 1 dependent variables.)
    * 종속변수가 양적변수가 아닌 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: Dependent variable should be numeric. Analysis has been stopped.)
    * 설명변수가 선택되지 않았을 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: At least 1 independent variable should be selected. Analysis has been stopped.)
    * 변수 사이에 선형 관계가 있는 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: Linear dependency between columns of the design matrix (including the intercept) detected. Please check the values of independent/dependent variables.)