Rex 분석 : 분할표분석

  1. 분석모듈 설명
  2. 분할표 분석은 두 개 범주형 변수에 대한 독립성, 연관성 및 일치성 분석을 수행할 수 있는 통계분석 모듈입니다. 두 변수의 결합 확률이 주변 확률의 곱과 같다면 두 변수는 통계적으로 독립이라고 정의합니다. 분할표에서 독립성 검정은 종속 변수가 명목형 또는 순서형에 따라 카이제곱 검정(chi-square test), Fisher의 정확 검정, 가능도비 검정, 명목형*순서형 독립성 검정, 순서형*순서형 독립성 검정 및 Wilcoxon-Mann-Whitney 검정을 실시합니다. 또한 연관성 분석에서는 두 범주형 변수간의 연관성을 종속 변수의 유형에 따라 측정합니다. 두 개의 종속 변수가 모두 명목형 일 경우, 분할계수, 파이, Cramer의 V, 람다 및 불확실성(uncertainty) 계수를 계산합니다. 두 개의 종속 변수가 모두 숫자형 일 경우에는 Pearson의 상관계수, Spearman의 상관계수, 감마, Somer의 D, Kendall의 타우-b 및 Kendall의 타우-c를 계산합니다. Cochran-Mantel-Haenszel 검정(CMH test)에서는 제어 변수의 각 수준을 독립된 모집단으로 간주하여 종속 변수의 분포가 모든 모집단에서 동일한지를 검정합니다. 일치성 검정(test of consistency)으로 Kappa, McNemar(짝지은 표본 분석) 방법이 지원됩니다.
  3. 분석에 사용된 R 패키지 및 함수
    •  	
    • 분할표
    • * stats 패키지의 xtabs 함수
    • 독립성 검정
    • * chi-square test : stats 패키지의 test 함수 * fisher’s exact test : stats 패키지의 test 함수 * nominal order test : vcdExtra 패키지의 CMHtest 함수 * ordinal-ordinal test : coin 패키지의 lbl_test 함수 * Wilcoxon-Mann-Whitney test : stats 패키지의 test 함수
    • 연관성 검정
    • * contingency coefficient, phi, cramer’s V, Goodman-Kruskal Gamma, Somer’sD, Kendall’s tau-b, Kendall’s tau-c : oii 패키지의 measures 함수 * pearson correlation, Spearman correlation : stats 패키지의 test 함수 * eta : lsr 패키지의 etaSquared 함수
    • Cochran-Mantel-Haenszel 검정
    • * CMH test : vcdExtra 패키지의 CMHtest 함수
    • 일치성 검정
    • * Kappa : vcd 패키지의 Kappa 함수 * McNemar : stats 패키지의 test 함수
  4. User interface: 변수설정 탭
    • 
      
       	
    • 입력 데이터 형식
    • - 데이터 : 엑셀 스프레드시트에 데이터가 있는 경우 선택합니다. - 2*2 분할표 : 2*2 분할표를 직접 입력할 경우 선택합니다.
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 종속 변수
    • - 종속 변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 필수로 두 개의 변수가 선택되어야 하며 명목형 또는 순서형으로 구분하여 지정할 수 있습니다. - 순서 척도가 있는 범주형 변수를 순서형으로 지정하고 순서가 없는 범주형 변수를 명목형 변수로 지정합니다. - 명목형 종속 변수의 경우, 숫자형으로 되어 있는 경우에도 문자로 인식되어 분석에 사용됩니다.
    • 제어변수(선택)
    • - 제어변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 종속 변수와 중복되어 선택될 수 없습니다. - 한 개의 변수를 입력 받을 수 있지만, 변수를 선택하지 않아도 분석을 시할 수 있습니다.
    • 빈도변수(선택)
    • - 빈도변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 종속 변수, 통제변수와 중복되어 선택될 수 없습니다. - 한 개의 변수를 입력 받을 수 있지만, 변수를 선택하지 않아도 분석을 시행할 수 있습니다.
    • 빈도표
    • - 2*2 빈도표에서 빈도를 직접 입력하여 분석을 실시합니다. - 각 범주별 빈도를 입력하면 빈도 합은 자동적으로 계산됩니다. - 각 변수 및 범주의 이름의 기본값은 X(yes, no), Y(yes, no)이며 사용자가 임의로 수정가능합니다.
  5. User interface: 분석옵션 탭
    • (독립성 검정) Pearson 카이제곱 검정, 가능도비 G제곱 검정, Fisher의 정확 검정(조건 만족시 실행)
    • - Pearson 카이제곱 검정을 실시하려면 이 옵션을 선택하십시오. - 2*2 분할표보다 큰 경우, p-value는 Monte Carlo 시뮬레이션으로 계산됩니다.
    • 독립성 검정: 명목형*순서형 독립검정
    • - 변수설정 탭에서 선택된 두 개의 종속 변수 중, 하나가 명목형이고 다른 하나라 순서형일 경우. - 변수설정 탭에서 선택된 순서형 종속 변수의 범주별로 점수를 부여합니다. - 점수의 기본값은 나열된 순서대로 1, 2, … 로 부여됩니다. - 각 범주의 점수를 변경하고 싶은 경우, 적용목록에 있는 해당 범주를 삭제한 후, 순서형에서 해당 범주를 선택한 후 직접 점수를 입력할 수 있습니다.
    • (독립성 검정) 순서형*순서형 독립검정
    • - 변수설정 탭에서 선택된 두 개의 종속 변수 모두가 순서형일 경우. - 변수설정 탭에서 선택된 순서형 종속 변수의 범주별로 점수를 부여합니다. - 점수의 기본값은 나열된 순서대로 1, 2, … 로 부여됩니다. - 각 범주의 점수를 변경하고 싶은 경우, 적용목록에 있는 해당 범주를 삭제한 후, 순서형에서 해당 범주를 선택한 후 직접 점수를 입력할 수 있습니다.
    • (독립성 검정) Whitney Wilcox 검정
    • (연관성 측도)명목형 데이터 분석
    • - 변수설정 탭에서 선택된 두 개의 종속 변수 모두가 명목형일 경우. - 명목형 데이터에 대해 연관성 분석을 실시하려면 이 옵션을 선택하십시오. - Contingency coefficient, Phi, Cramer’s V, Lambda, Uncertainty coefficient 값이 계산됩니다.
    • (연관성 측도)순서형 데이터 분석
    • - 변수설정 탭에서 선택된 두 개의 종속 변수 모두가 순서형일 경우. - 순서형 데이터에 대해 연관성 분석을 실시하려면 이 옵션을 선택하십시오. - Contingency coefficient, Phi, Cramer’s V, Lambda, Uncertainty coefficient Pearson’s correlation, Spearman’s correlation, Gamma, Somner’s D, Kendall’s tau-b, Kendall’s tau-c 값이 계산됩니다.
    • (연관성 검정: 명목) 구간 데이터 분석
    • - 변수설정 탭에서 선택된 두 개의 종속 변수 중, 하나가 명목형이고 다른 하나라 순서형일 경우. - 명목형:구간형 데이터에 대해 연관성 분석을 실시하려면 이 옵션을 선택하십시오. - 변수설정 탭에서 선택된 순서형 종속 변수의 범주별로 점수를 부여합니다. - 점수의 기본값은 구간에 나열된 순서대로 1, 2, … 로 부여됩니다. - 각 범주의 점수를 변경하고 싶은 경우, 적용목록에 있는 해당 범주를 삭제한 후, 구간에서 해당 범주를 선택한 후 직접 점수를 입력할 수 있습니다. - Contingency coefficient, Phi, Cramer’s V, Lambda, Uncertainty coefficient, Eta 값이 계산됩니다.
    • (일치성 검정) Kappa: Kappa 검정을 실시하려면 이 옵션을 선택하십시오.
    • (일치성 검정) McNemar: McNemar 검정을 실시하려면 이 옵션을 선택하십시오.
    • (Cochran-Mantel-Haenszel 검정) Cochran-Mantel-Haenszel test, Mantel-Haenszel statistic, Breslow-Day test
    • - 변수설정 탭에서 제어변수가 선택되었을 때 활성화됩니다. - Cochran-Mantel-Haenzel 검정, Mantel-Haenszel statistic, Breslow-Day 검정을 실시하려면 이 옵션을 선택하십시오.
  6. User interface: 출력옵션 탭
    • (빈도) 관측빈도: 결과 출력창에 관측빈도를 포함하려면 이 옵션을 선택하십시오.
    • (빈도) 기대빈도: 결과 출력창에 기대빈도를 포함하려면 이 옵션을 선택하십시오.
    • (백분율) 행 백분율: 결과 출력창에 행 백분율을 포함하려면 이 옵션을 선택하십시오.
    • (백분율) 열 백분율: 결과 출력창에 열 백분율을 포함하려면 이 옵션을 선택하십시오.
    • (백분율) 총계 백분율: 결과 출력창에 총계 백분율을 포함하려면 이 옵션을 선택하십시오.
    • (잔차) 잔차: 결과 출력창에 비표준화 잔차를 포함하려면 이 옵션을 선택하십시오.
    • (잔차) 표준화 잔차: 결과 출력창에 표준화 잔차를 포함하려면 이 옵션을 선택하십시오.
    • (잔차) 수정된 표준화 잔차: 결과 출력창에 수정된 표준화 잔차를 포함하려면 이 옵션을 선택하십시오.
    • 조건부분할표: 제어변수를 선택하였을 경우, 제어변수의 수준별로 위의 분석 결과들을 결과 출력창에 포함하려면 이 옵션을 선택하십시오.
  7. 결과출력창 해석
    •  	
    • Data Structure: 전체 관측치 수(Number of observations), 분석에 사용된 변수의 수(Number of variables)를 나타냅니다.
    • Variable List: 변수설정 탭에서 선택된 종속 변수 및 통제변수의 이름 및 범주를 나타냅니다.
    • Analysis Description: 시행할 독립성 검정(Independent Test), 연관성 검정(Association Test), 일치성 검정(Consistency Test)의 세부 분석명을 나타냅니다.
    • Contingency Table
    • - 출력옵션에서 선택한 분할표를 출력합니다. - 통제변수가 있을 경우, 통제변수의 각 범주별 조건부 분할표(Conditional Contingency Table)과 주변부 분할표(Marginal Contingency Table)을 출력합니다.
    • Cochran-Mantel-Haenszel Test: 변수설정 탭에 통제변수가 있고, 분석옵션 탭에서 Cochran 및 Mantel-Haenzel 통계량을 선택하였을 때, Cochran-Mantel-Haenszel 분석 결과를 출력합니다.
    • Independence Test
    • - Analysis Description의 독립성 검정(Independent Test)에 나열된 세부 분석 결과를 출력합니다. - 통제변수가 있을 경우, 통제변수의 각 범주별로 독립성 검정(Independent Test)을 실시합니다.
    • Association Test
    • - Analysis Description의 연관성 검정(Association Test)에 나열된 세부 분석 결과를 출력합니다. - 통제변수가 있을 경우, 통제변수의 각 범주별로 연관성 검정(Association Test)을 실시합니다.
  8. Warning 메세지
  9. * 각 범주별 빈도 합이 0인 경우, 해당 범주는 분석에서 제외되며, 제외한 후 남은 범주의 수가 한 개일 경우에는 아래의 메시지와 함께 분석이 종료됩니다 (Error message : After dropping unused levels, only one level has left. Analysis does not work)
    * Cochran-Mantel-Haenszel 검정시, 조건부 분할표의 주변부가 0을 가지고 있으면 아래의 메시지와 함께 분석이 Cochran-Mantel-Haenszel 검정이 시행되지 않습니다 (Error message : The conditional contingency table contains zero margins. CMH test does not work)
    * Kappa 분석시, 혼동 행렬(Confusion matrix) 형태가 아니면 아래의 메시지와 함께 Kappa 분석이 시행되지 않습니다 (Error message : Kappa can be applied for the confusion matrix.)