데이터 준비

Rex를 이용한 자료분석을 위해 Excel에 입력된 자료는 다음과 같이 준비되어 있어야 합니다.
  1. 데이터 구조
    • Excel은 테이블 구조로써, 열 (Excel 화면 상단의 A, B, C, …) 과 행 (Excel 화면 좌측의 1, 2, 3, …) 으로 구성됩니다 (그림 1). 【그림 1】과 같이, Rex는 Excel의 하나의 열을 하나의 관측변수 (예: 키, 몸무게) 로 인식하며, 하나의 행을 각각의 관측변수에 대해 한 개체로부터 얻어진 관측값으로 인식합니다. 각각의 행은 레코드 (record) 라고 합니다.
    • 【그림 1】 Rex에서 Excel의 행과 열의 의미
  2. 헤더
    • 【그림 2】와 같이 Excel 화면에서 첫번째 줄 (화면 좌측의 번호가 1)을 헤더 (header)라고 하며, Rex는 헤더를 각 열의 이름으로 인식합니다.
    • 【그림 2】 첫번째 행의 의미와 분석 제외 조건
    주의사항 
    
    * 헤더에 값이 없는 열은 분석에서 제외됩니다.
    * 헤더는 space, 탭 등의 특수문자 및 숫자를 포함해서도 안됩니다. 분석을 수행하기 전에 헤더가 모두 영문으로 구성되어 있는지 반드시 확인하기 바랍니다.
    
  3. 레코드 구성
  4. Rex는 헤더를 제외한 두번째 줄 (【그림 3】에서 화면 좌측의 번호가 2인 줄)부터 레코드로 인식합니다. 또한 헤더 변수들은 같은 수의 관측값을 갖는다고 인식합니다. 예를 들어 첫번째 열은 10개의 행, 두번째 열은 15개의 행으로 구성된 경우 Rex는 레코드는 총 15개의 행으로 구성되어 있다고 간주하고, 첫번째 열은 5개의 결측값이 있다고 판단합니다.

    【그림 3】 레코드의 정의와 결측치의 정의
    주의사항
     
    * 각 셀이 공란이거나 NA로 되어 있으면, 해당 관측값은 결측치로 인식합니다.
    
  5. 변수의 형태
  6. Rex는 두 가지 형태의 변수(명목형, 측정형)를 다룰 수 있습니다.
     주의사항
    * 명목형 변수는 값의 크기가 의미는 없고, 같은 값인지 구분만 가능한 경우를 의미합니다. 예를 들어 남성, 여성과 같은 값을 갖는 성별 등이 명목형 변수에 해당합니다.
    * 측정형 변수는 순서형 변수, 연속형 변수 등을 의미하며, 값 자체가 수치적 의미를 가지고 상호간의 대소 비교가 가능한 변수입니다. 모든 행의 값이 숫자로 구성되어 있으면 측정형 변수로 인식하며, 문자가 한개 이상 있는 경우 명목형 변수로 인식합니다. 
    * 만약 측정형 변수를 명목형 변수로 처리하고 싶은 경우 Rex의 메뉴에서 범주형 변수로 지정하면 됩니다.