Rex 분석 : 다변량분산분석

  1. 분석모듈 설명
  2. 다변량분산분석(multivariate analysis of variance)은 두 개 이상의 집단의 평균을 비교하고자 할 때 집단 내의 분산, 집단 간 분산의 비교를 통해 가설검정을 수행하는 분산분석을 확장하여 두 개 이상의 종속변수가 서로 관계된 상황에서 수행할 수 있는 통계분석 모듈입니다. 다변량분산분석(multivariate analysis of variance)을 수행하기 위해서는 관측 값이 서로 독립이며, 각 집단의 분산-공분산 행렬이 동일하고, 각 집단 내에서 모든 종속변수가 다변량 정규분포(multivariate normal distribution)를 따른다는 가정이 필요합니다. Wilk의 검정, Lawley-Hotelling 검정, Pillai의 검정, Roy의 최대근 검정을 수행할 수 있습니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * Main results : stats 패키지의 manova 함수, car 패키지의 Manova 함수
    * Shapiro-Wilk Test : stats 패키지의 shapiro.test 함수
    * Box's M test : biotools 패키지의 boxM 함수
    * Coefficents estimates : stats 패키지의 lm  함수
    * 위에 나열된 결과 외에는 R의 기본 함수를 사용하였음.
  5. User interface: 변수설정 탭
    • 
       	
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 종속변수
    • - 종속변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 필수로 두 개 이상의 변수가 선택되어야 하며 양적 변수(Quantitative variable)만 가능합니다. - 종속변수에 결측치가 존재하는 관측치는 분석에서 제외됩니다.
    • 요인
    • - 요인(factor)에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 필수로 한 개 이상의 범주형 변수(질적변수)가 선택되어야 합니다. - 질적변수(Qualitative variable)에 결측치가 존재하는 관측치는 분석에서 제외됩니다.
    • 주효과(main effect): 요인으로 선택된 변수들 중 최종 모형에 포함시킬 주효과 변수를 선택합니다.
    • 교호작용(interaction): 요인으로 선택된 변수들 중 2개 이상의 변수가 선택되었을 때 요인간의 교호작용을 최종모형에 포함시킬 수 있습니다.
    • 상수항 포함하지 않음: 상수항을 포함하지 않으려면 이 옵션을 선택하십시오.
  6. User interface: 분석옵션 탭
    • 
       	
    • 제곱합 유형
    • - Type I, Type II, Type III 중 한 개를 선택하십시오.
    • 통계량
    • - Pillai, Hotelling-Lawley, Wilks, Roy 중 출력하고자 하는 통계량을 선택하십시오. - 복수로 선택할 수 있으며, 아무것도 선택하지 않을 시 Pillai 통계량이 출력됩니다.
  7. User interface: 분석옵션 탭
    • 
      	
    • 박스그림: 결과출력창에 요인의 수준(level)별로 종속변수의 박스그림(box plot)을 그리려면 이 옵션을 선택하십시오.
  8. 결과출력창 해석
    •  	
    • Data Structure: 결측이 없는 관측치 수(Number of observations), 분석에 사용된 종속 변수의 수(Number of dependent variables), 분석에 사용된 요인의 수(Number of factors)를 나타냅니다.
    • Variable List: 종속변수(dependent variables)와 요인(factor)로 선택된 변수들을 나타냅니다.
    • Analysis Description: 적합 모형(Fitted model), 검정통계량(Test statistics), 제곱합(Sums of Squares)유형을 나타냅니다.
    • Scatter Plots: 분석에 이용된 변수들의 관계를 확인할 수 있는 산점도(Scatter plots)를 나타냅니다.
    • Assessing Test Assumptions
    • – Univariate Normality : 각 종속변수의 정규성 여부를 위하여 Shapiro-Wilk 검정과 정규 QQ 그림을 제공합니다. – Multivariate Normality : 종속변수의 다변량 정규성 여부를 위하여 Multivariate Shapiro-Wilk 검정과 다변량 QQ 그림을 제공합니다. – Box's M Test for Homogeneity of Covariance Matrices between Groups in Factors : 종속변수들의 공분산행렬(Covariance matrix)이 요인의 수준별로 차이가 있는지의 여부를 검정하기 위하여 Box의 M 검정을 제공합니다. 각 요인의 수준별로 표본공분산행렬(Sample covariance matrix)와 통합공분산행렬(Pooled covariance matrix)을 제공합니다. 수준별 공분산행렬에 차이가 없다는 귀무가설에 대한 검정결과를 제공합니다.
    • Coefficient Estimates
    • – 종속변수 별로 일변량 분산분석을 통해 추정된 요인의 효과에 대한 추정량을 나타냅니다.
    • Multivariate ANOVA Table with Type ** SS
    • – 다변량 분산분석표(Multivariate ANOVA Table)를 나타냅니다. – 선택한 통계량에 따라 Roy, Wilks, Hotelling-Lawley, Pillai와 그에 대응되는 자유도(DF)가 출력됩니다. – F 통계량 값(approx F)과 F 통계량의 분자의 자유도(num Df), 분모의 자유도(den Df), 유의확률 (Pr(>F)) 값이 출력됩니다.
    • Box plot
    • - 종속변수 별로 각 요인의 수준에 따른 종속변수의 박스그림이 출력됩니다.
  9. Warning 메세지
    • 아무런 요인도 포함하지 않으면 아래의 메시지와 함께 분석이 종료됩니다 (Error : At least 1 factor should be selected. Analysis has been stopped.)
    • 요인으는 질적 변수가 포함되어야 하며 양적변수가 선택될 경우 아래의 메시지와 함께 해당 요인을 질적 변수로 고려하여 분석이 수행됩니다 (Warning : The type of variable OOO is numeric but selected as the qualitative variable. It was coerced into character.)
    • 다변량분산분석을 수행할 수 없으면 아래의 메시지와 함께 분석이 종료됩니다 (Error : Fail to fit the multivariate Analysis of Variance.)