Rex 분석 : 반복측정회귀분석

  1. 분석모듈 설명
  2. 반복측정 자료분석(longitudinal data analysis)은 동일 관측치(observation)들에 대하여 시간의 흐름에 따라 종속변수(dependent variable)가 여러 번 측정된 자료를 분석하는 통계분석 모듈입니다. 이러한 자료는 보통 추적조사(follow-up study)에서 얻어지는데, 동일 관측치에서 얻어진 값들은 서로 상관성(correlation)을 띄고 있기 때문에 선형회귀분석을 적용할 수 없습니다. 상관성을 고려하기 위하여 관측치에 대한 임의효과(random effect)를 절편(intercept) 혹은 시점변수의 기울기(slope)에 포함하는 일반화 선형 혼합 모형(generalized linear mixed model)이 모듈에 사용되었습니다. 이를 통하여 절편, 시점 그리고 다른 추가 설명변수(explanatory variable)들의 고정효과(fixed effect)를 추정할 수 있고, 임의효과들의 분산(variance)도 추정할 수 있습니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * lme4 패키지의 lmer 함수
  5. User interface: 변수설정 탭
    • 변수목록: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 종속변수
    • - 종속변수에 해당하는 변수를 변수목록으로부터 선택할 수 있습니다. - 필수로 한 개의 변수가 선택되어야 하며 양적변수(quantitative variable)만 가능합니다. - 모든 시점에 대한 종속변수가 하나의 변수로 입력되어야 합니다.
    • 시간변수
    • - 시간변수(time variable)는 종속변수가 관측된 시점에 해당하는 변수를 의미하며, 변수목록으로부터 선택할 수 있습니다. - 필수로 한 개의 변수가 선택되어야 하며, 문자형변수 또는 숫자형변수 모두 선택 가능합니다.
    • 관측단위변수
    • - 관측된 종속변수에 해당하는 정보를 포함한 관측단위변수(ID variable)가 선택되어야 합니다. - 필수로 한 개의 변수가 선택되어야 하며, 문자형변수 또는 숫자형변수 모두 선택 가능합니다.
    • 질적변수, 양적변수
    • - 설명변수와 도구변수에 포함될 변수들의 유형을 지정해줍니다. - 종속변수, 시간변수, 관측단위 변수와 중복되어 선택될 수 없습니다. - 질적변수(qualitative variable)와 양적변수는 서로 중복되어 선택될 수 없습니다. - 질적변수로 선택된 변수들은 문자로 인식되어 분석에 사용됩니다. - 문자형변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다. - 한 개 이상의 변수를 입력할 수 있지만 선택하지 않아도 분석을 실시할 수 있습니다.
    • 최종모형
    • - 질적변수 혹은 양적변수로 정의된 변수들 중 분석에 포함할 변수를 선택할 수 있는데, 여러 변수를 중복 선택하여 주효과 버튼을 클릭하면 최종모형에 주효과들이 포함되고, 교호작용 버튼을 클릭하면 선택된 변수들의 교호작용이 최종모형에 포함됩니다. - 설명변수와 선택된 변수에서 결측치를 포함하는 관측치는 분석에서 제외됩니다.
    • 상수항 포함하지 않음
    • - 고정효과 중 상수항(intercept)을 포함하지 않으려면 이 옵션을 선택하십시오. - 최종모형으로 아무런 변수가 선택되지 않는다면 이 옵션을 선택할 수 없습니다. (시간변수가 고정변수로 포함되기 때문)
  6. User interface: 분석옵션 탭
    • 시간변수를 숫자로 변환
    • - 변수설정 탭에서 입력 받은 시간변수를 숫자코딩으로 변환하는 옵션입니다. - 콤보박스를 클릭하면 ‘자동변환’ 혹은 ‘사용자 정의’를 선택할 수 있는데, ‘자동변환’은 오름차순으로 0부터 1씩 증가한 값이 할당됩니다. ‘사용자 정의’를 선택하면 직접 숫자로 변환할 값을 시간 별로 지정할 수 있습니다.
    • 임의효과
    • - 관측치에 대한 임의효과(random effect)를 절편에 추가하려면 ‘관측 단위에 따라 절편이 다름을 가정’ 옵션을 선택하십시오. - 관측치에 대한 임의효과를 시간의 기울기에 추가하려면 ‘관측 단위에 따라 시간에 따른 종속변수의 변화율이 다름을 가정’ 옵션을 선택하십시오. - 위의 두 옵션 중 하나는 반드시 선택되어야 합니다. - 관측치에 대한 임의효과를 절편과 시간의 기울기에 모두 추가한 경우, 두 임의효과 사이에 상관성이 존재함을 가정하려면 ‘임의효과 사이에 상관성이 있음을 가정’ 옵션을 선택하십시오.
    • 분산 추정방법: 콤보박스를 클릭하면 분산을 추정하는 방법으로 ‘최대가능도방법(maximum likelihood method)’과 ‘제한 최대가능도방법(restricted maximum likelihood method)’ 중 하나를 선택할 수 있습니다.
  7. User interface: 출력옵션 탭
    • 잔차그래프: 결과출력창에 잔차(residual) 그래프를 추가하려면 이 옵션을 선택하십시오.
    • 관측단위 별 프로파일 그래프: 결과출력창에 시간에 따른 관측단위 별 프로파일(profile) 그래프를 추가하려면 이 옵션을 선택하십시오.
    • 적합값: 적합값(fitted value)을 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: Fitted_Longi)
    • 잔차: 잔차를 엑셀 시트에 저장하려면 이 옵션을 선택하십시오. (저장될 변수 이름: Resid_Longi)
  8. 결과출력창 해석
    •  	
    • Data Structure: 전체 관측치 수(the number of observations), 전체변수의 수(the number of variables), 분석에 사용된 변수의 수(the number of used variables)를 나타냅니다.
    • Variable List
    • - 질적변수와 양적변수로 선택된 변수들 중 분석에 사용된 변수를 나타냅니다. - 질적변수로 포함된 변수는 무조건 문자형변수로 변환되어 분석에 사용됩니다. - 문자형변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다.
    • Analysis Description: 종속변수, 설명변수, 시간변수, 관측단위변수, 상수항 포함 여부(intercept included), 절편에 임의효과 포함 여부(random effect on intercept), 시간변수의 기울기에 임의효과 포함 여부(random effect on time)를 나타냅니다.
    • Profile Plot: 관측단위 별 프로파일 그래프로, X 축은 시간, Y 축은 종속변수이고 각 셀은 관측치를 나타냅니다.
    • Transformed Time Variable: 시간변수의 수준 별 할당된 숫자 코딩을 나타냅니다.
    • Fixed effects: 시간변수와 설명변수의 고정효과 추정치(estimate of fixed effects)를 나타냅니다.
    • Random effects: 임의효과의 분산 추정치를 나타냅니다.
    • Measures of Goodness of Fit: 적합된 모형의 AIC값을 나타냅니다.
    • Residual Plot: 적합된 모형의 잔차그래프를 나타냅니다.
  9. Warning 메세지
  10. * 종속변수가 양적변수가 아닌 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: Dependent variable should be numeric. Analysis has been stopped.)
    * 관측치에 대한 임의효과가 절편과 시간의 기울기 모두에 포함되지 않으면 아래의 메시지와 함께 분석이 종료됩니다 (Error: No random effects term was specified by user. Analysis has been stopped.)