CART(Classification and Regression Trees) 알고리즘
개념
- CART는 지니 지수(범주형 목표변수인 경우 적용) 또는 분산의 감소량(연속형 목표변수인 경우 적용)을 이용하여 이진분리(binary split)를 수행하는 알고리즘
stopping criteria
- all cases in a node have identical values for all predictors
- the depth of the tree has reached its pre-specified maximum value
- the size of the node is less than a pre-specified minimum node size
- the node becomes pure
- the maximum decrease in impurity is less than a pre-specified value