Rex 분석 : 주성분분석

  1. 분석모듈 설명
  2. 주성분분석(Principal Component Analysis, PCA)은 데이터들의 주성분을 찾는 모듈입니다. 즉, 서로 상관성이 높은 여러 변수들의 선형조합으로 만든 새로운 변수들로 요약 및 축소하는 분석방법입니다. 요인 분석과 달리, 목표 변수를 고려하여 잘 예측하고 분류하기 위해서 기존 변수들의 선형 결합으로 이루어진 주성분을 찾는 분석 방법입니다.
  3. 분석에 사용된 R 패키지 및 함수
  4. * psy 패키지의 plot 함수
    * psych 패키지의 factanal 함수
  5. User interface: 변수설정 탭
    • 전체변수: 엑셀 스프레드시트에 있는 변수의 목록을 나타냅니다.
    • 선택변수
    • - 선택변수에 해당하는 변수를 전체변수로부터 선택할 수 있습니다. - 적어도 두 개 이상의 변수가 선택되어야 하며 양적변수만 가능합니다. - 분산의 표준화를 원하면 이 옵션을 선택하면 됩니다.
  6. User interface: 출력옵션 탭
    • 
       	
    • 스크리 그래프 출력: 결과출력창에 스크리 그래프(scree graph)를 포함하려면 이 옵션을 선택하십시오. (저장될 변수 이름: SP_PC)
    • 주성분점수 출력
    • - 결과출력창에 주성분점수를 포함하려면 이 옵션을 선택하십시오 (저장될 변수 이름: PCprint). - 이 때 기본값은 2이며, 출력할 주성분의 수를 정할 수 있습니다.
  7. 결과출력창 해석
    •  	
    • Data Structure: 전체 관측치 수(the number of observations), 전체변수의 수(the number of variables) 를 나타냅니다.
    • Analysis Description: 선택변수, 분산 정규화(scaling variances)와, 출력된 주성분의 수(the number of printed PCs)를 나타냅니다.
    • PCA Results: 주성분분석 결과를 제공합니다.
    • Descriptive Statistics: 평균과 분산을 제공합니다.
    • Variable Loadings: 적재량에 대한 결과를 제공합니다.
    • Importance of Components: 주성분에 관한 결과를 주성분 별로 결과를 제공합니다.
    • Scree plot: 스크리 그래프를 제공합니다.
  8. Warning 메세지
  9. * 2 개 이하의 변수가 선택된 경우 아래의 메시지와 함께 분석이 종료됩니다 (Error: At least 2 variables should be selected. Analysis has stopped.)
    * 변수가 범주형변수를 포함할 경우, 아래의 메시지와 함께 분석에서 제외 혹은 종료됩니다 (Error: PCA supports only numeric variables but categorical variables were selected. They were excluded from the analysis.)