의사결정나무 (Decision Tree)

의사결정나무 (Decision Tree)

여러가지 규칙을 순차적으로 적용하면서 독립변수 공간을 분할하는 분류 모형이다. 분류 및 회귀분석에 모두 사용할 수 있기 때문에 CART(Classification And Regression Tree)라고 한다.

1. 분류법

– 독립변수중 하나의 독립변수를 선택하고 그 독립변수에 개한 기준값(threshold)를 정한다. 즉 분류규칙을 만든다.

– 데이터 집합(부모노드)을 해당 독립변수의 값이 기준값보다 작은 데이터 그룹(자식노드1) 과 해당 독립변수의 값이 기준값보다 큰 데이터 그룹(자식노드 2)로 나눈다.

– 각각의 자식 노드에 대해 위 단꼐를 반복하여 하위의 자식 노드를 만든다. 단 자식 노드에서 한가지 클래스의 데이터만 존재한다면 더 이상 자식 노드를 나누지 않고 중지한다.

2. 분류예측

 

 

 

답글 남기기