데이터마이닝 기말문제
- 최초 등록일
- 2014.12.18
- 최종 저작일
- 2014.10
- 6페이지/ 한컴오피스
- 가격 1,000원
목차
제1장 데이타마이닝의 주요 개념
제2장 Enterprise Miner 맛보기
제3장 의사결정나무분석
제4장 회귀분석
제5장 신경망분석
제6장 예측모형에 대한 평가
제7장 데이터의 탐색과 변형 (6장 다시 적기)
제8장 군집분석
제9장 연관성규칙발견
본문내용
제1장 데이타마이닝의 주요 개념
- CRM 이란?
Customer Relationship Management의 약자로 우리말로는 '고객관계관리'라고 한다.
기업이 고객과 관련된 내외부 자료를 분석·통합해 고객 중심 자원을 극대화하고 이를 토대로 고객특성에 맞게 마케팅 활동을 계획·지원·평가하는 과정이다.
- 데이타마이닝의 특징
·정의: 데이터베이스, 데이터웨어하우스, 데이터마트 등 자료 저장소에 저장되어 있는 방대한 양의 데이터로부터 의사결정에 도움이 되는 유용한 정보를 발견하는 작업들의 집합
·1980년대 이후, 다양한 형태의 데이터베이스 시스템 출현.
·관련분야 : 지식발견(KKD), 기계학습, 패턴인식, 통계학, 뉴로컴퓨팅
·활용분야 : 데이터베이스 마케팅, 신용평가, 품질관리, 부정행위의 적발, 이미지분석
·특징 : ① 대용량의 관측 가능한 자료를 다룬다.
②컴퓨터 중심적 기법이다.
③경험적 방법에 근거하고 있다.
④일반화에 초점을 두고 있다.
⑤기업의 경쟁력 확보를 위한 의사결정을 지원한다.(활용↑)
⑥통계학, 컴퓨터과학, 인공지능, 공학과 같은 분야에서 개발 됐지만, 실제로는 경영, 경제, 정보기술에서 사용한다.
<중 략>
제3장 의사결정나무분석
- tree output을 보고 분류(예측)하기
부모마디에서 자식마디로 갈수록 순수도↑, 분리기준이란 부모마디에 비해서 자식마디들에서 순수도가 증가하는 정도를 수치화한 것
- 분류나무의 경우 카이제곱 통계량의 p-값에 의한 가지분리원리
각 범주에 속하는 빈도에 기초하여 분리, p-값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식마디를 형성
- 회귀나무의 경우 F통계량의 p-값에 의한 가지분리원리
목표변수의 평균과 표준편차에 기초하여 분리, p-값이 가장 작은 예측변수와 그 때의 최적분리에 의해서 자식마디가 형성
- tree분석의 장단점
·장점
해석의 용이성: 뿌리마디로부터 끝마디까지 따라가기만 하면 되기 때문에 모형을 적합시키 기가 쉽다. 어떤 입력변수가 목표변수를 설명하기 위해 더 중요한지 쉽게 파악 가능
참고 자료
없음