KDD 분석 방법론

개념

  • KDD(Knowledge Discovery in Databases)는 1996년 Fayyad가 체계적으로 정리한 데이터 마이닝 프로세스
  • 데이터베이스에서 의미있는 지식을 탐색하는 데이터 마이닝부터, 기계학습, 인공지능, 패턴인식, 데이터 시각화 등에서 응용될 수 있는 구조


패턴 찾는 프로세스(9개 단계)


  • 분석 대상 비즈니스 도메인의 이해
  • 분석 대상 데이터셋 선택과 생성
  • 데이터에 포함되어 있는 노이즈(Noise)와 이상값(outlier) 등을 제거하는 정제작업이나 전처리
  • 분석 목적에 맞는 변수를 찾고 필요시 데이터의 차원을 축소하는 데이터 변경
  • 분석 목적에 맞는 데이터 마이닝 기법 선택
  • 분석 목적에 맞는 데이터 마이닝 알고리즘 선택
  • 데이터 마이닝 시행
  • 데이터 마이닝 결과에 대한 해석
  • 데이터 마이닝에서 발견된 지식 활용

이 블로그의 인기 게시물

USArrests(1973년 미국 50개주 십만명당 강력범죄수)

SRTP(Secure Real-Time Transport Protocol)

군집분석(Cluster Analysis)