Rex 그래픽스: 밀도추정 그림

  1. 분석모듈 설명
  2. 데이터가 분포를 통해 밀도를 추정하여 표현한 그림을 그립니다. Smoothing kernel과 대역폭을 설정할 수 있으며, 집단변수가 있는 경우 색상으로 집단 수준을 구분하여 겹치거나 쌓아 올린 그림으로 나타냅니다.
  3. User interface: 변수설정 탭
  4. 
    
    • 데이터
    • * 전체변수 – 시트에서 선택된 데이터의 변수 목록입니다. * 변수(필수) – 밀도추정 그림으로 나타낼 변수입니다. 전체변수 중 원하는 변수 한 개를 선택하여 오른쪽 방향 화살표를 클릭하면 추가됩니다. 변수의 제거를 원할 경우, 변수를 선택한 뒤 왼쪽 방향 화살표를 클릭하거나 변수 이름을 더블 클릭합니다 참고: 일부 문자열이 포함된 변수는 해당 관측값을 결측으로 처리하여 작업합니다. 모든 관측값이 문자열인 경우는 작동하지 않습니다. * 집단변수(선택) – 관측값이 포함되는 집단 정보를 나타낼 변수입니다. 전체변수 중 원하는 변수 한 개를 선택하여 오른쪽 방향 화살표를 클릭하면 추가됩니다. 변수의 제거를 원할 경우, 변수를 선택한 뒤 왼쪽 방향 화살표를 클릭하거나 변수 이름을 더블 클릭합니다. 참고: 집단변수는 숫자를 포함한 모든 값을 문자로 처리하여 작업합니다. 또한 집단변수에 결측이 존재하는 경우 이에 상응하는 변수 역시 결측으로 간주합니다.
  5. User interface: 출력옵션 탭
  6. 
    
    • 그림선택기능
    • * Kernel – 다음 옵션을 사용할 수 있습니다. Gaussian: Gaussian function (표준정규분포 확률밀도함수)을 kernel로 사용하여 밀도 추정을 합니다. Epanechnikov: Epanechnikov (parabolic) kernel function을 사용하여 밀도 추정을 합니다. Biweight: Biweight (quartic) kernel function을 사용하여 밀도 추정을 합니다. * 대역폭 – 다음 옵션을 사용할 수 있습니다. nrd0: Silverman의 'rule of thumb' 방법을 사용하여 대역폭을 계산합니다. (Silverman, 1986) nrd: Scott (1992) 에서 제안한 방법을 사용하여 대역폭을 계산합니다. SJ: Sheather & Jones (1991) 에서 제안한 방법을 사용하여 대역폭을 계산합니다. adjust: 위에서 선택한 방법으로 계산된 대역폭에 곱해질 값을 설정합니다. 밀도하한: 밀도추정 그림에 나타날 최소 밀도 한계를 설정합니다. 설정한 값 이하의 밀도를 갖는 X축 영역은 나타나지 않습니다. 설정하지 않은 경우 최적의 범위를 자동으로 결정합니다. * 축 크기조정 – 다음 옵션을 사용할 수 있습니다. 밀도: Y축의 척도가 각 구간의 관측값 비율을 퍼센트로 나타냅니다. 빈도수 세기: Y축의 척도가 각 구간의 관측값 개수를 나타냅니다. * 집단기준 – 다음 옵션을 사용할 수 있습니다. 개별적으로: 집단변수를 기준으로 데이터를 분할한 뒤 색상으로 구분하여 밀도추정 그림을 개별적으로 그립니다. 면적에 0보다 큰 수를 설정한 경우, 겹치는 부분은 두 색상 이상이 융합되어 나타납니다. 누적(Stack): 집단을 색상으로 구분하여 하나의 밀도추정 그림을 그립니다. 집단변수가 선택되지 않을 때와 동일한 밀도추정 그림에서 X축 변수의 값이 변화할 때 각각의 집단 수준이 차지하는 비율을 나타냅니다. 채우기: 집단을 색상으로 구분하여 모든 X축 변수의 값에서 밀도를 1로 환산했을 때의 밀도추정 그림을 그립니다. 특정 X축 변수의 값에 대해 추정된 밀도에서 집단 수준 별로 차지하는 비율이 얼마인지를 나타냅니다. 참고: [그림선택기능-집단기준] 옵션은 집단변수가 선택될 때만 활성화됩니다. 또한 [그림선택기능-집단기준-채우기] 옵션은 집단변수가 선택되고 [축 크기조정-밀도] 옵션이 선택될 때만 활성화됩니다.
    • 그림 이름표
    • * 그래프제목 – 그래프의 제목을 지정합니다. * X축 이름표 – 그래프의 X축 이름을 지정합니다. (기본값: 선택한 변수 이름) * Y축 이름표 – 그래프의 Y축 이름을 지정합니다. (기본값: Density, Proportion 혹은 Count)
    • 그림크기
    • * 가로크기 – 출력되는 그래프의 가로 크기를 설정합니다. (단위: 픽셀) * 세로크기 – 출력되는 그래프의 세로 크기를 설정합니다. (단위: 픽셀) * 글자크기(DPI) – 출력되는 그래프의 글자 크기를 설정합니다. 참고: 출력물 품질을 위한 DPI 설정을 기반으로 하는 옵션입니다.
    • 범례
    • * 위치 – 다음 옵션을 사용할 수 있습니다. 위: 범례를 밀도추정 그림의 위쪽에 나타냅니다. 아래: 범례를 밀도추정 그림의 아래쪽에 나타냅니다. 오른쪽: 범례를 밀도추정 그림의 오른쪽에 나타냅니다. 왼쪽: 범례를 밀도추정 그림의 왼쪽에 나타냅니다. 없음: 범례를 나타내지 않습니다. 참고: [범례-위치] 옵션은 집단변수가 선택될 때만 활성화됩니다.
    • 색상
    • * 투명도 – 알파 채널 (alpha channel) 값을 나타냅니다. 0은 밀도 곡선 아래의 면적이 완벽하게 투명한 상태이며, 1은 면적이 곡선의 색상과 동일하게 지정됩니다. * 곡선색상 – 출력되는 밀도 곡선의 색상을 선택합니다. (기본값: 검정) * (집단색상) – 집단변수의 집단 수준이 콤보박스에 나타나며, 각 집단 수준에 대해 색상을 선택할 수 있습니다. (기본값: 집단 수준의 개수를 HCL color space에 대응) 참고: [색상-(집단색상)] 옵션은 집단변수가 선택될 때만 활성화됩니다. * 색상 변경 방법: 오른쪽 hex code를 클릭하면 색상 선택을 위한 팝업 창이 나타나고, 원하는 색을 선택하여 확인 버튼을 클릭하면 해당 색상과 hex code로 변경되는 것을 확인할 수 있습니다.
  7. Reference
    • * Silverman, B. W. (1986) Density Estimation. London: Chapman and Hall.
      * Sheather, S. J. and Jones, M. C. (1991) A reliable data-based bandwidth selection method for kernel density estimation. Journal of the Royal Statistical Society series B, 53, 683–690.
      * Scott, D. W. (1992) Multivariate Density Estimation: Theory, Practice, and Visualization. Wiley.
      * Venables, W. N. and Ripley, B. D. (2002) Modern Applied Statistics with S. Springer.