배깅(bagging, bootstrap aggregating)
개념
- 배깅(bagging)은 bootstrap aggregation으로서, 주어진 데이터에 대해 여러 개의 bootstrap 자료를 생성하고 각 bootstrap 자료를 모델링 한 후 결함하여 최종의 예측 모형을 산출하는 방법
- 주어진 데이터(training set)에서 랜덤하게 subset을 N번 sampling 해서(observations과 features들을 random하게 sampling) N개의 예측모형을 만들어 개별 예측모형이 voding 하는 방식으로 예측결과를 결정(Low Bias는 유지하고 High Variance는 줄이는 방법)
- bootstrap 자료 : 단순 복원 임의 추출법(random sampling)을 통해 원자료(raw data)로 부터 크기가 동일한 여러 개의 표본 자료
예측변수 결합방법
- 목표변수가 연속형일 때 평균(average)
- 목표변수가 범주형일 때 투표(majority vote)