Rex 메뉴 : 통계분석

  • Rex v1.0의 통계분석은 총 10개의 분석 대메뉴로 구성되어 있습니다. 지원하는 분석의 종류는 다음과 같습니다

기술통계
그룹비교
회귀분석
상관분석
범주형 자료분석
분류분석
차원축소
시계열분석
생존분석
데이터요약
평균비교
일표본 T 검정
선형 회귀분석
이변량상관
분할표분석
비지도 학습
K-평균 군집
요인 분석
시계열 자료탐색
생명표
독립표본 T 검정
가중선형 회귀분석
편상관
로그선형분석
계층적 군집
대응일치 분석
지수평활법
Kaplan-Meier
대응표본 T 검정
편최소제곱
거리 측도
DBSCAN
주성분 분석
ARIMA 모형
Cox 비례위험모형
일원배치 분산분석
이분형 로지스틱
PAM 군집
GARCH 모형
다변량 분산분석
다형 로지스틱
지도 학습
의사결정나무
비율비교
일표본 비율검정
포아송 회귀분석
판별분석
이표본 비율검정
2-단계 최소제곱
K최근접 이웃기법
분산비교
등분산검정
반복측정 회귀분석
SVM
다변량 회귀분석
  • 기술통계량
  • 선택된 변수에 대하여 평균, 분산과 같은 기술통계량을 계산합니다. 또한 집단변수의 수준 별로 기술통계량을 계산하는 것도 가능합니다.

  • 결측치대체
  • 관측값에 결측치가 존재하면 해당 관측값은 통계 분석에서 제외되므로, 결측치를 대체하여 분석을 수행하는 것이 더 효율적입니다. 공백과 NA를 결측치로 인식함을 꼭 기억하기 바랍니다.

  • 그룹비교
  • 그룹비교는 한 그룹의 모평균/모비율/모분산이 특정값과 같은지, 혹은 서로 다른 그룹의 모평균/모비율/모분산이 서로 같은지 비교하는 경우에 이용합니다. 평균 비교는 그룹의 개수 및 표본의 유형(대응/독립)에 따라 분석 방법이 달라집니다. 예를 들어 그룹의 수가 2이고 독립표본을 비교하는 경우 이표본T검정, 그룹의 수가 3개 이상인 경우에는 일변량분산분석을 이용하면 됩니다.

  • 회귀분석
  • 회귀분석은 한 개 이상의 설명변수를 이용하여 반응변수를 추정하는 회귀방정식을 구할 때 이용합니다. 반응변수가 정규분포를 따르면 선형회귀분석, 포아송분포를 따르면 포아송회귀분석, 이항분포를 따르면 이항자료회귀분석, 다항분포를 따르면 다항자료회귀분석을 이용하면 됩니다. 한 개체로부터 두 개 이상의 관측값이 얻어진 경우에는 반복측정회귀분석을 수행해야 하며, 반응변수가 정규분포를 따르는 경우에만 이용할 수 있습니다.

  • 상관분석
  • 상관분석은 두 개 이상의 변수 사이의 상관계수 혹은 거리를 계산할 때 이용합니다. 이변량상관은 두 변수 사이의 상관계수를 계산할 때 이용합니다. 편상관은 세 개 이상의 변수가 존재하는 경우 다른 변수의 효과를 보정한 뒤에 남은 변수 사이의 상관계수를 구할 때 사용합니다. 마지막으로 거리측도는 변수 혹은 관측값 사이의 거리를 계산합니다.

  • 범주형자료분석
  • 범주형자료분석은 범주형 변수 사이의 연관성을 추론하는 경우에 이용하며, 분석에 포함된 모든 변수를 범주형 변수로 간주합니다. 분할표 분석은 범주형 종속변수가 2개 있는 경우에 이용하며, 필요에 따라 범주형 통제변수를 추가할 수 있습니다. 종속변수가 3개 이상이고, 설명변수가 없는 경우에는 로그선형모형을 이용하기 바랍니다.

  • 분류분석
  • 지도학습은 판별분석을 수행하여 범주형 변수의 예측 모형을 개발하는 경우에 이용하며, 비지도학습은 군집분석을 수행하여 군집을 추정하고자 하는 경우에 이용합니다.

  • 차원축소
  • 표본의 크기에 비하여 많은 수의 변수가 존재하는 경우, 적은 수의 새로운 변수를 정의하여 분석하면 좀 더 효율적인 분석을 수행할 수 있습니다. 차원축소는 이처럼 많은 수의 변수로부터 새로운 변수를 정의하고 싶은 경우에 이용합니다.

  • 시계열분석
  • 시계열분석은 환율, 주가와 같이 시간에 따라 연속적으로 관측되는 변수를 종속변수로 이용하여 분석하는 경우에 이용합니다. Rex는 한 가지의 시계열 데이터만을 종속변수로 간주할 수 있으며, 예를 들어 두 회사 A, B의 주가에 동시에 영향을 주는 변수의 분석은 불가능합니다. 시계열 분석을 수행하기 전에 먼저 시계열자료탐색을 수행하여 정상성 등의 기본 가정이 만족되는지 반드시 확인하기 바랍니다.

  • 생존분석
  • 생존분석은 사망(혹은 사건)이 일어날 때까지 걸린 시간을 종속변수로 이용하여 분석하는 경우에 이용합니다. 사망이 일어날 때까지 걸린 시간 정보를 갖고 있는 시간변수, 그리고 해당 시점에서 사망이 일어났는지 여부에 대한 상태변수가 반드시 정의되어 있어야 생존분석이 가능합니다.