Rex 분석 : 로그선형분석

  1. 분석모듈 설명
  2. 로그선형분석은 분할표의 셀 빈도를 범주형 변수들의 관계로 표현하며, 이를 통해 변수들 사이의 연관성(association)과 교호작용(interaction)을 분석할 수 있는 통계분석 모듈입니다. 분할표 분석에서는 변수들 사이의 연관성(association)을 설명할 수 있지만 어떤 범주가 중요한 역할을 하는지는 알기 어렵습니다. 로그선형분석에서는 셀의 기대 빈도의 로그값이 설명변수의 선형함수(linear function)로 표현되어, 변수들 사이의 관계를 설명합니다. 본 모듈에서는 사용자가 세운 선형모형(linear model)에 대한 적합도 검정(goodness-of-fit test), 설명변수에 대한 모수 추정 및 가설 검정을 실시할 수 있습니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * Main results : stats 패키지의 glm 함수
    * Confidence interval : stats 패키지의 confint 함수
    * Model fitness measurements : stats 패키지의 deviance, residuals, logLik, AIC, BIC 함수
    * ANOVA table : stats 패키지의 anova 함수, car 패키지의 Anova 함수
    * 위에 나열된 결과 외에는 R의 기본함수를 사용하였음.
    
  5. User interface: 변수설정 탭
    • 
       	
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 설명변수
    • - 설명변수에 해당하는 변수를 전체변수로부터 선택합니다. - 필수로 한 개 이상의 변수가 선택되어야 합니다. - 설명변수는 질적변수(Qualitative variable)를 선택하여야 하며, 숫자형으로 되어 있는 경우 문자로 인식하여 분석에 사용됩니다.
    • 최종모형
    • - 질적변수로 정의된 변수들 중 분석에 포함할 변수를 선택할 수 있는데, 여러 변수를 중복 선택하여 주효과 버튼을 클릭하면 최종모형에 주효과들이 포함되고, 교호작용 버튼을 클릭하면 선택된 변수들의 교호작용이 최종모형에 포함됩니다. - 설명변수로 선택된 변수에서 결측치를 포함하는 관측치(observation)는 분석에서 제외됩니다.
    • 빈도변수
    • - 빈도변수(frequency variable)에 해당하는 변수를 전체변수로부터 선택합니다. - 설명변수와 중복되어 선택될 수 없습니다. - 한 개의 변수를 입력 받을 수 있지만, 변수를 선택하지 않아도 분석을 시행할 수 있습니다.
  6. User interface: 출력옵션 탭
    • 
      	
    • 회귀계수
    • - 신뢰구간: 결과출력창에 회귀계수 추정값의 신뢰구간(confidence interval)을 출력하려면 이 옵션을 선택하십시오. - 신뢰수준(Confidence level)으로 0 과 1 사이의 값을 지정할 수 있습니다.
    • 지수 모수 추정량: 결과출력창에 지수(exponential) 회귀계수 추정값을 출력하려면 이 옵션을 선택하십시오.
    • 분산분석표
    • - 결과출력창에 분산분석표(ANOVA table)를 포함하려면 이 옵션을 선택하십시오. - 제곱합(sum of squares)의 유형으로 Type I, II, III 중 하나를 선택할 수 있습니다. 각 유형은 다음과 같습니다. - Type I: 설명변수를 순차적으로(sequentially) 하나씩 추가하며 제곱합의 증가량을 계산합니다. 설명변수가 다항식(polynomial)인 경우에 적합합니다. - Type II: 모든 주 효과가 포함된 모형에서 하나의 주 효과가 제거될 때 발생하는 제곱합의 감소량을 계산합니다. 실제 모형이 주효과만으로 구성되어 있을 때 적합합니다. - Type III: 사용자에 의해 지정된 모든 효과가 포함된 모형에서 하나의 효과가 제거될 때 발생하는 제곱합의 감소량을 계산합니다. - 분산분석표는 포화모형(saturated model)에 대해서는 지원되지 않습니다.
    • 그래프
    • - 막대그래프: 결과출력창에 막대그래프(bar graph)을 출력하려면 이 옵션을 선택하십시오. 막대그래프는 각 설명변수의 수준별 빈도를 확인할 때 유용합니다. - 풍선그래프: 결과출력창에 풍선그래프(balloon graph)을 출력하려면 이 옵션을 선택하십시오. 풍선그래프는 각 설명변수의 수준별 상대빈도(relative frequency)를 확인할 때 유용합니다. - 모자이크그래프: 결과출력창에 모자이크그래프(mosaic graph)을 출력하려면 이 옵션을 선택하십시오. 모자이크그래프는 각 설명변수의 수준별 상대빈도(relative frequency)를 확인할 때 유용합니다. - 모든 그래프는 설명변수의 수가 3개 이하일 경우에만 지원됩니다.
    • 분할표
    • - 결과출력창에 분석에 사용된 질적변수들의 분할표(contingency table)을 출력하려면 이 옵션을 선택하십시오. 분할표는 질적변수의 수가 3개 이하일 때만 지원됩니다.
  7. 결과출력창 해석
    •  	
    • Data Structure: 결측이 없는 관측치의 수(Number of non-missing observations), 전체 변수의 수(Number of total variables), 분석에 사용된 변수의 수(Number of used variables)를 나타냅니다.
    • Variable List: 변수설정 탭에서 선택된 양적변수(Quantitative variable)와 질적변수(Qualitative variable)을 나타냅니다.
    • Analysis Description: 분석 모형(Model), 포화모형여부(Saturated model)를 나타냅니다.
    • Contingency Table: 분할표를 나타냅니다.
    • Bar Plot: 막대그래프를 나타냅니다. Y축은 빈도를 의미합니다.
    • Ballon Plot
    • - 풍선그래프를 나타냅니다. - 분석에 사용된 모든 질적변수의 수준의 조합에 대한 관측치의 빈도(Frequency) 및 비율(Proportion)을 나타냅니다. - 빈도가 커짐에 따라 풍선의 크기는 커지고, 색상은 붉은색에서 노란색으로 변화합니다.
    • Mosaic Plot
    • - 모자이크그래프를 나타냅니다. - 하나의 질적변수가 선택된 경우, x축은 질적변수의 각 수준의 빈도에 비례하게 나타납니다. 전체 관측치 수에 대한 각 수준의 백분율(percent)이 표시됩니다. - 두 개의 질적변수가 선택된 경우, x축은 첫 번째 변수의 수준의 빈도에 비례하게 나타납니다. y축은 첫 번째 변수의 수준을 고정시켰을 때의 두 번째 변수의 각 수준의 빈도에 비례하게 나타나고, 대응되는 백분율이 표시됩니다. - 세 개의 질적변수가 선택된 경우, y축은 세 번째 변수의 빈도에 비례하게 나타납니다. 세 번째 변수의 수준 별로, x축과 y축은 각각 첫 번째, 두 번째 변수의 빈도에 비례하게 나타납니다. 표시되는 숫자는 세 번째 변수의 수준을 고정시켰을 때의 첫 번째, 두 번째 변수의 수준에 대한 백분율을 나타냅니다.
    • Coefficient Estimates
    • - 설명변수의 모수 추정치를 나타냅니다. - 각 열은 모수 추정치(Estimate), 지수모수추정치(exp(Estimate)), 표준오차(SE), 검정통계량(Z-value), 유의확률(P-value), Wald와 profile likelihood 신뢰구간(**% CI)를 나타냅니다.
    • Model Fitness Measurements: 이탈도(Deviance), 피어슨의 카이제곱(Pearson's chi-square), -2*로그우도값(-2*log-likelihood), Akaike information criterion(AIC), BIC 등 모형의 적합도를 나타내는 여러 값들을 표시합니다.
    • ANOVA Table
    • - 분산분석표를 출력합니다. - Type I 제곱합인 경우 영모형(Null model)과의 자유도 차이(DF), 영모형과의 이탈도 차이(Deviance), 잔차제곱합의 자유도(Residual DF), 이탈도(Residual Deviance), 유의확률(P-value)를 나타냅니다. - Type II, III 제곱합인 경우 회귀제곱합의 감소량(SS), 영모형과의 자유도 차이(DF), F 통계량(F-value), 유의확률(P-value)을 나타냅니다.
  8. Warning 메세지
  9. * Wald통계량은 가정한 모형에서는 계산이 불가능합니다 (Error message : Wald test is not supported for the saturated model)
    * Wald통계량은 가정한 모형에서 type I SS 계산이 불가능합니다 (Error message : Wald test for type I SS is not available)
    * 추정된 모수에 사용된 오차 통계량이 Type2 또는 Type3이며, Wald 통계량으로 가설 검정을 하는 경우, 포화 모형일 때 아래의 메시지와 함께 분석이 시행되지 않습니다 (Error message : Wald test is not supported for the saturated model.)
    * 추정된 모수에 사용된 오차 통계량이 Type1이고, Wald 통계량으로 가설 검정을 하는 경우 아래의 메시지와 함께 분석이 시행되지 않습니다 (Error message : Wald test for type I SS is not available)