배깅(bagging, bootstrap aggregating)

개념

  • 배깅(bagging)은 bootstrap aggregation으로서, 주어진 데이터에 대해 여러 개의 bootstrap 자료를 생성하고 각 bootstrap 자료를 모델링 한 후 결함하여 최종의 예측 모형을 산출하는 방법
  • 주어진 데이터(training set)에서 랜덤하게 subset을 N번 sampling 해서(observations과 features들을 random하게 sampling) N개의 예측모형을 만들어 개별 예측모형이 voding 하는 방식으로 예측결과를 결정(Low Bias는 유지하고 High Variance는 줄이는 방법)
  • bootstrap 자료 : 단순 복원 임의 추출법(random sampling)을 통해 원자료(raw data)로 부터 크기가 동일한 여러 개의 표본 자료

예측변수 결합방법

  • 목표변수가 연속형일 때 평균(average)
  • 목표변수가 범주형일 때 투표(majority vote)

이 블로그의 인기 게시물

USArrests(1973년 미국 50개주 십만명당 강력범죄수)

SRTP(Secure Real-Time Transport Protocol)

KDD 분석 방법론