Rex 분석 : Kaplan-Meier분석

  1. 분석모듈 설명
  2. 카플란 마이어 생존분석(Kaplan-Meier analysis)은 사건(사망)이 발생한 시점마다의 구간 생존율을 누적한 누적 생존율을 추정하는 비모수적(nonparametric) 통계분석 모듈입니다. 생존분석에서의 분석 대상은 사건 발생까지의 시간(time to event)입니다. 먼저 관찰된 순서대로 자료를 정리하고, 사건(사망)이 발생한 시점마다 구간 생존율을 계산하여 누적 생존율을 계산하며, 이 때 누적 생존율은 각 구간별 구간 생존율을 차례로 곱함으로써 추정할 수 있습니다. 카플란 마이어 생존함수 그래프의 X축에는 시간이 표시되고, Y축에는 각 시점에서 생존자의 비율이 표시되며 누적 곡선은 각 시점에서 사건이 발생할 때마다 계단 모양으로 나타납니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * Life table : survival 패키지의 Surv, survfit 함수
    * Test between groups : survival 패키지의 survdiff 함수
    * 위에 나열된 결과 외에는 R의 기본함수를 사용하였음.
    
  5. User interface: 변수설정 탭
    • 
       	
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 입력 데이터 형식
    • - 원데이터: 사건(event) 혹은 중도절단(censoring)이 발생할 때마다 발생한 시간과 상태(사건 혹은 중도절단)를 모아놓은 데이터로, 데이터가 시간변수(time variable)와 상태변수(status variable)로 구성된 경우 선택하십시오. - 병합데이터: 시간별로 발생한 사건의 수와 중도절단의 수를 모아놓은 데이터로, 데이터가 시간변수와 사건변수(event variable), 중도절단변수(censoring variable)로 구성된 경우 선택하십시오.
    • 시간변수
    • - 시간변수에 해당하는 변수를 변수목록으로부터 선택할 수 있습니다. - 반드시 한 개의 변수가 선택되어야 하며 양의 실수(positive real value)를 가진 변수만 가능합니다.
    • 상태변수
    • - 입력 데이터가 원데이터 형식인 경우 활성화됩니다. - 사건 혹은 중도절단의 정보를 담고 있는 상태변수(status variable)에 해당하는 변수를 변수목록으로부터 선택할 수 있습니다. - 반드시 한 개의 변수가 선택되어야 하며 두 개의 수준(level)으로 이루어진 변수만 가능합니다. - 사건: 상태변수의 두 수준 중 사건(event)에 해당하는 수준을 선택합니다. 선택되지 않은 나머지 변수는 자동으로 중도절단(censoring)으로 설정됩니다. 생존분석에서 사건은 보통 질병의 발생, 사망 등을 의미합니다.
    • 사건변수
    • - 입력 데이터가 병합데이터 형식인 경우 활성화됩니다. - '사건의 수' 정보를 담고 있는 사건변수(event variable)에 해당하는 변수를 변수목록으로부터 선택할 수 있습니다. - 반드시 한 개의 변수가 선택되어야 하며 음이 아닌 정수(non-negative integer)로 이루어진 변수만 입력 가능합니다. - 생존분석에서 사건은 보통 질병의 발생, 사망 등을 의미합니다.
    • 중도절단변수
    • - 입력 데이터가 병합데이터 형식인 경우 활성화됩니다. - '중도절단의 수' 정보를 담고 있는 중도절단변수(censoring variable)에 해당하는 변수를 변수목록으로부터 선택할 수 있습니다. - 반드시 한 개의 변수가 선택되어야 하며 음이 아닌 정수(non-negative integer)로 이루어진 변수만 입력 가능합니다.
    • 집단변수
    • - 집단변수(group variable)에 해당하는 변수를 변수목록으로부터 선택할 수 있습니다. - 한 개의 질적변수(Quantitative variable)가 선택될 수 있으며, 숫자형 변수인 경우 질적변수로 인식되어 분석에 사용됩니다.
  6. User interface: 출력옵션 탭
    • 
      
      	
    • 집단 간 생족곡선 차이 검정
    • - 변수설정 탭에서 집단변수를 선택한 경우, '집단 간 생존곡선(survival curve)의 차이가 없다'라는 귀무가설에 대한 양측검정(two sided test)을 실시하려면 이 옵션을 선택하십시오.
    • 신뢰수준
    • - 그래프의 신뢰구간(confidence interval)을 위한 신뢰수준(confidence level)을 0 과 1 사이의 숫자로 입력할 수 있습니다.
    • 생존함수: 결과출력창에 생존함수(survival function) 그래프를 추가하려면 이 옵션을 선택하십시오.
    • 1-생존함수: 결과출력창에 1-생존함수(1-survival function) 그래프를 추가하려면 이 옵션을 선택하십시오.
    • 로그생존함수: 결과출력창에 로그생존함수(log-survival function) 그래프를 추가하려면 이 옵션을 선택하십시오.
    • 누적위험함수: 결과출력창에 누적위험함수(cumulative hazard function) 그래프를 추가하려면 이 옵션을 선택하십시오.
  7. 결과출력창 해석
    • 	
    • Data Structure: 결측이 없는 관측치 수(Number of non-missing observations), 전체변수의 수(Number of total variables), 분석에 사용된 변수의 수(Number of used variables)를 나타냅니다.
    • Variable List
    • - 양적변수(Quantitative variable)와 질적변수(Qualitative variable)로 선택된 변수들 중 분석에 사용된 변수를 나타냅니다. - 질적변수로 포함된 변수는 무조건 문자형변수로 변환되어 분석에 사용됩니다. - 문자형변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다.
    • Analysis Description
    • - 원데이터를 선택한 경우, 시간변수(Time variable), 상태변수(Status variable), 사건 및 중도절단 코딩(Labels for event status), 집단변수(Group variable)가 출력됩니다. - 병합데이터를 선택한 경우, 시간변수(Time variable), 사건변수(Event variable), 중도절단변수(Censoring variable), 집단변수(Group variable)가 출력됩니다.
    • Life Table
    • - 추정된 생명표(life table)을 나타냅니다. - 각 열은 시간(Time), 상태의 변화가 발생할 수 있는 사람의 수(atRisk), 사건이 발생한 사람의 수(Events), 중도절단이 발생한 사람의 수(Censoring), 생존확률의 추정치(Survival), Survival의 표준오차(SE(Survival)), Survival의 신뢰구간을 나타냅니다. - 여기서 생존은 사건 혹은 중도절단이 일어나지 않았음을 의미합니다. - 집단변수가 선택된 경우, 집단변수의 수준별로 생명표가 나타납니다.
    • Test Survival Curve Differences between Groups
    • - 출력옵션 탭에서 집단 간 생존곡선 차이 검정 옵션을 선택한 경우 출력됩니다. - Table for Observed VS Expected Events: 집단변수의 수준별로 사건의 관측빈도(Observed events)와 기대빈도(Expected events)를 나타냅니다. - Pearson's chi-squared test: '집단 간의 생존곡선에 차이가 없다'라는 귀무가설에 대한 양측검정에 대한 결과를 나타냅니다. 각 열은 카이제곱 통계량(Chisq), 자유도(DF), 유의확률(P-value)를 나타냅니다.
    • Survival function: 추정된 생존함수 그래프를 나타냅니다. 그룹변수가 선택되었으면 그룹의 수준별로 그려집니다.
    • 1-Survival function: 추정된 1-생존함수 그래프를 나타냅니다. 그룹변수가 선택되었으면 그룹의 수준별로 그려집니다.
    • Log Survival function: 추정된 로그생존함수 그래프를 나타냅니다. 그룹변수가 선택되었으면 그룹의 수준별로 그려집니다.
    • Cumulative Hazard function: 추정된 누적위험함수 그래프를 나타냅니다. 그룹변수가 선택되었으면 그룹의 수준별로 그려집니다.
  8. Warning 메세지
  9. * 시간변수가 양의 실수가 아닌 경우 다음 메시지와 함께 분석이 종료됩니다 (Error : Time variable should be positive numeric. Analysis has been stopped.)
    * 사건변수가 음이 아닌 정수가 아닌 경우 다음 메시지와 함께 분석이 종료됩니다 (Error : Event variable should be non-negative integer. Analysis has been stopped.)
    * 중도절단변수가 음이 아닌 정수가 아닌 경우 다음 메시지와 함께 분석이 종료됩니다 (Error : Censoring variable should be non-negative integer. Analysis has been stopped.)