Rex 분석 : 기술통계

  1. 분석모듈 설명
  2.  기술 통계량은 표본 자체의 속성을 파악하기 위하여 데이터 요약을 제공하는 통계분석 모듈입니다. 기술통계는 데이터의 속성을 특정한 통계량을 사용해서 그 요약을 보여줍니다. 기술통계는 매우 간단한 통계량으로 엄청난 양의 데이터가 갖는 속성을 합리적인 방법으로 간결하게 요약해 줌으로써, 연구자가 데이터의 속성을 쉽게 이해할 수 있도록 도와주기에 매우 중요한 분석이라고 할 수 있습니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * Mean : base 패키지의 mean 함수
    * Median : stats 패키지의 median 함수
    * Standard deviation : stats 패키지의 sd 함수
    * Variance : stats 패키지의 var 함수
    * Skewness : moments 패키지의 skewness 함수
    * Kurtosis : moments 패키지의 kurtosis 함수
    * 위에 나열된 결과 외에는 R의 기본 함수를 사용하였음.
  5. User interface: 변수설정탭
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 양적변수(Quantitative variable)
    • - 연속형 변수(Continuous Variable)에 해당하는 변수를 전체변수로부터 선택합니다. - 한 개 이상의 변수가 선택될 수 있으며, 질적변수와 중복되어 선택될 수 없습니다. - 양적 변수만 사용 가능합니다.
    • 질적변수(Qualitative variable)
    • - 범주형 변수(Categorical Variable)에 해당하는 변수를 전체변수로부터 선택합니다. - 한 개 이상의 변수가 선택될 수 있으며, 양적변수와 중복되어 선택될 수 없습니다. - 양적, 질적 변수 모두 사용 가능합니다.
    • 집단변수(Group Variable)
    • - 범주형 변수에 해당하는 변수를 전체변수로부터 선택합니다. 집단 변수는 하나만 선택 가능합니다. - 분석할 변수들의 집단(Group)을 설정합니다. - 질적변수, 양적변수와 서로 중복되어 선택될 수 없습니다.
  6. User interface: 출력옵션탭
    • 통계량 (Statistics)
    • – 변수설정 탭에서 양적변수와 질적변수가 선택됨에 따라 활성화되며, 선택된 통계량이 결과로 출력됩니다. – 전체선택/해체 버튼을 이용하여 모든 옵션을 선택 혹은 해제할 수 있습니다.
    • 그래프
    • – 변수설정 탭에서 양적변수와 질적변수가 선택됨에 따라 활성화되며, 선택된 그래프가 결과로 출력됩니다.
  7. 결과출력창 해석
    • Data Structure : 전체 관측치 수(Number of observations), 전체 변수의 수(Number of total variables), 분석에 사용된 변수의 수(Number of used variables)를 나타냅니다.
    • Variable List
    • - 질적변수와 양적변수로 선택된 변수들 중 분석에 사용된 변수를 나타냅니다. - 질적변수로 포함된 변수는 무조건 질적 변수로 변환되어 분석에 사용됩니다. - 질적 변수는 양적변수로 선택될 수 없으며, 선택된 경우 분석에서 제외됩니다.
    • Results of Descriptive Statistics
    • - 데이터에서 선택된 질적변수와 양적변수를 집단변수 별로 요약된 기술 통계량 값을 나타냅니다. - 질적변수의 경우, 범주형 변수로 간주하여 질적변수의 각 값들을 수준(Level)으로 설정한 빈도표(Frequency Table)을 나타냅니다. - 빈도표에서 제공하는 통계량은 빈도(Frequency), 누적빈도(Cumulative frequency), 상대빈도(Relative frequency), 누적상대빈도(Cumulative frequency), 퍼센트(Percent), 누적퍼센트(Cumulative percent), 유표퍼센트(Valid percent; 결측을 제외한 퍼센트), 누적유효퍼센트(Cumulative valid percent)입니다. - 양적변수의 경우, 선택된 양적변수의 기술 통계량을 표(Table)로 나타냅니다. - 계산되는 기초 통계량 값은 관측치 수(N.observed), 결측치(N.missing) 수, 평균(Mean), 중위수(Median), 최소값(Min), 최대값(Max), 제1사분위수(Q1), 제3사분위수(Q3), 범위(Range), 합계(Sum), 표준편차(SD), 분산(Variance), 왜도(Skewness), 왜도의 표준오차(Standard Error of Skewness), 첨도(Kurtosis), 첨도의 표준오차(Standard Error of Kurtosis)가 있습니다. - 이 때, 표준편차, 분산, 왜도, 첨도는 관측치의 수가 2개 이상인 경우에만 제공되며, 왜도와 첨도는 각각 관측치의 수가 3개, 4개 이상일 때 제공됩니다. - 집단변수가 선택되면 집단변수의 수준별로 결과가 출력됩니다.
    • 히스토그램 (Histogram)
    • - 선택된 양적변수 별로 히스토그램이 출력됩니다. 집단변수가 선택된 경우, 집단변수의 수준별로 출력됩니다.
    • 박스그림 (Box plot)
    • - 선택된 양적변수 별로 박스그림이 출력됩니다. 집단변수가 선택된 경우, 집단변수의 수준별로 출력됩니다
    • 줄기잎그림 (Stem and leaf plot)
    • - 선택된 양적변수 별로 줄기잎그림이 출력됩니다. 집단변수가 선택된 경우, 집단변수의 수준별로 출력됩니다
    • 정규 QQ 그림 (Normal QQ-plot)
    • - 선택된 양적변수 별로 정규 QQ 그림이 출력됩니다. 집단변수가 선택된 경우, 집단변수의 수준별로 출력됩니다.
    • 막대그림 (Bar plot)
    • - 선택된 질적변수 별로 막대그림이 출력됩니다. 집단변수가 선택된 경우, 집단변수의 수준별로 출력됩니다.
    • 원형표 (Pie Chart)
    • - 선택된 질적변수 별로 원형표가 출력됩니다. 집단변수가 선택된 경우, 집단변수의 수준별로 출력됩니다.
  8. Warning 메시지
  9. * 변수 타입으로 인해 선택된 모든 변수가 분석에서 제외된 경우 다음의 메시지와 함께 분석이 종료됩니다. (Error: At least one variable should be selected. Analysis has been stopped.)