의사결정나무 관련 질문드립니다.
안녕하세요 선생님
AUC24/MIC라는 연속변수(128~1159의 값을 가집니다)를 독립변수로,
30-day mortality라는 명목변수(0 or 1의 값을 가집니다)를 종속변수로 해서
의사결정 나무 분석을 통해 30-day mortality를 가장 잘 설명할 수 있는 AUC24/MIC 값을 찾으려고 합니다.
[분석옵션]은 회귀로 했고, [자료분할]에서는 분할검증을 선택했습니다.
(사실 자료분할은 어떻게 하는 것이 좋을지 몰라서 일단 default로 선택되어 있는 ‘분할검증’에 그대로 두었습니다)
전체 n=76,
30-day mortality 중 1의 값을 갖는 n=8, 0은 n=68입니다.
위와 같이 분석했더니 아래의 그림을 얻었는데요.
각 노드 아래의 0, 0.1, 0.2라는 값이 무엇을 의미하는건지 잘 모르겠어서 여쭤봅니다.
그 이하 분석 결과도 혹시 몰라 첨부합니다.
수고가 많으십니다. 감사합니다.
AUC24/MIC라는 연속변수(128~1159의 값을 가집니다)를 독립변수로,
30-day mortality라는 명목변수(0 or 1의 값을 가집니다)를 종속변수로 해서
의사결정 나무 분석을 통해 30-day mortality를 가장 잘 설명할 수 있는 AUC24/MIC 값을 찾으려고 합니다.
[분석옵션]은 회귀로 했고, [자료분할]에서는 분할검증을 선택했습니다.
(사실 자료분할은 어떻게 하는 것이 좋을지 몰라서 일단 default로 선택되어 있는 ‘분할검증’에 그대로 두었습니다)
전체 n=76,
30-day mortality 중 1의 값을 갖는 n=8, 0은 n=68입니다.
위와 같이 분석했더니 아래의 그림을 얻었는데요.
각 노드 아래의 0, 0.1, 0.2라는 값이 무엇을 의미하는건지 잘 모르겠어서 여쭤봅니다.
그 이하 분석 결과도 혹시 몰라 첨부합니다.
Complexity Parameter Table of Fitted Tree
|
Validation using training dataset
|
Comparison Plot (Train)
수고가 많으십니다. 감사합니다.
“의사결정나무 관련 질문드립니다.”의 1개의 생각
답글 남기기
번호
제목
날짜
조회수
04/28
2670
05/18
854
05/18
1240
04/28
2670
04/27
1146
04/28
927
04/20
945
04/21
1325
04/10
1365
04/09
1008
04/04
1001
03/28
1262
03/30
1042
03/28
835
04/02
918
03/18
907
03/18
1032
03/18
825
03/11
1195
03/11
730
안녕하세요, 렉스소프트입니다.
보내주신 내용을 보니 30-day 내에 사망에 대한 예, 아니오 판단이 가능한’분류’를 위한 의사결정나무를 만드시는 것인데,
분석옵션에서 ‘회귀’를 선택하셔서, 0, 1코딩을 명목이 아닌 양적변수로 간주하여, 실제 해당 노드에서 예측되는 양적값으로 0, 0.1, 0.2 등의 값이 산출된 것으로 보입니다.
분석옵션을 ‘분류’로 변경해서 다시 분석해보시기 바랍니다.
감사합니다.
렉스소프트 드림.