의사결정나무(2) (Decision Tree)

의사결정나무(2) (Decision Tree) 의사결정나무의 분류 모델을 설명하고 Information Gain 에 대해서 설명한다. 1. 의사결정나무 분류 모델 concept 파란색 점이 들어 왔을 때 파란색점은 빨강색으로 예측 초록색 점이 들어오면 주위의 검정색 점이 5개로 검정색으로 예측 2….

분류모형

분류모형 classification 은 독립변수값이 주어졌을 때 그 값과 가장 연관성이 큰 종속변수값을 예측하는 것이다. 어떤 표본에 대한 데이터가 주어졌을 때 그 표본이 어떤 카테고리 혹은 클래스에 속하는지를 알아내는 문제이다. 1. 분류 모형의 종류 주어진 데이터에…

랜덤포레스트 (Random Forests)

랜덤포레스트 – Random Forest 의사 결정나무의 단점에 대해서 아래 주소에 정리 의사결정나무(2) (Decision Tree) 단점을 간략히 정리하면 1) 에러가 다음 단계 까지 전파가 되고, 2)학습데이터에 민감하고, 3)적은 개수의 노이즈에도 영향이 크고, 4)과적합의 위험이 있다 이것에…

의사결정나무(1) (Decision Tree)

의사결정나무(1) (Decision Tree) 데이터에 내재되어 있는 패터을 변수의 조합으로 나타내는 예측/분류 모델을 나무 형태로 만드는 것이다. “스무고개” 놀이랑 비슷하다. 1. 의사결정나무 개요 데이터를 알고리즘을 이용하여 모델을 만드는 것 데이터를 2개 혹은 그 이상의 부분집합으로 분할…