KDD 분석 방법론
개념 KDD(Knowledge Discovery in Databases)는 1996년 Fayyad가 체계적으로 정리한 데이터 마이닝 프로세스 데이터베이스에서 의미있는 지식을 탐색하는 데이터 마이닝부터, 기계학습, 인공지능, 패턴인식, 데이터 시각화 등에서 응용될 수 있는 구조 패턴 찾는 프로세스(9개 단계) 분석 대상 비즈니스 도메인의 이해 분석 대상 데이터셋 선택과 생성 데이터에 포함되어 있는 노이즈(Noise)와 이상값(outlier) 등을 제거하는 정제작업이나 전처리 분석 목적에 맞는 변수를 찾고 필요시 데이터의 차원을 축소하는 데이터 변경 분석 목적에 맞는 데이터 마이닝 기법 선택 분석 목적에 맞는 데이터 마이닝 알고리즘 선택 데이터 마이닝 시행 데이터 마이닝 결과에 대한 해석 데이터 마이닝에서 발견된 지식 활용