데이터 마이닝 요약본
- 최초 등록일
- 2009.07.15
- 최종 저작일
- 2009.07
- 3페이지/ 한컴오피스
- 가격 1,000원
소개글
데이터 베이스중 데이터 마이닝이라는 요약본입니다.
목차
1. 의사 결정 지원 시스템
2. 데이터 분석과 OLAP
3. 데이터 웨어하우징
3. 데이터 마이닝 (DB상에서의 지식 탐사)
본문내용
1. 의사 결정 지원 시스템
■ 트랜잭션 처리 시스템: 트랜잭션에 대한 정보를 기록하는 시스템
■ 의사 결정 지원 시스템: 의사결정을 도와줌
2. 데이터 분석과 OLAP
■ 온라인 분석 처리(OLAP)
● 척도: 값의 계산이나 총계를 구하는 사용
● 차원속성: 다른 속성들 일부 혹은 전체
● 다차원 데이터: 차원 속성과 ㅊㅓㄱ도 속성으로 모델링 가능한 데이터
3. 데이터 웨어하우징
: 여러 근원지들로부터 모은 정보를 단일 사이트에 일관된 스키마로 저장한 저장소(기록 보관소)
■ 데이터 웨어하우스를 구축하는데 있어 언급되어야 할 문제점
● 언제 그리고 어떻게 데이터를 수집할 것인가?
- 근원지 구동 구조: 자료 수집을 위해서 데이터 근원지에서 새로운 정보를 계속해서 혹은 주기적으로
전송한다.
- 목적지 구동 구조: 데이터 웨어하우스가 정기적으로 근원지로 새로운 데이터에 대한 요청을 보냄
● 어떠한 스키마를 사용할 것인가?
- 데이터 근원지들은 서로 독립적으로 구축되었기 때문에 서로 상이한 스키마를 갖게되며 서로 다른
데이터 모델을 가지는 경우도 있음
- 데이터 웨어하우스의 기능 중 한 부분은 스키마를 통합하는 것이며, 통합 스키마로의 변환 작업 수행
데이터 웨어하우스에 저장되는 데이터는 그에 대한 실체화 뷰라고 생각하는 것이 옳음.
● 데이터 변형 및 클렌징: 데이터 보정 및 전처리 작업
- 피지 검색: 데이터를 근사적으로 비교하는 작업
- 결합 및 정화 연산: 중복 데이터 제거
- 하우스홀딩: 하나의 주소에 사는 여러 사람들의 경우 하나로 묶는 연산
- 변형: 척도 단위 변경이나 여러 근원지의 릴레이션 데이터를 조인하기 위해 다른 스키마로 변환
● 갱신을 어떻게 전파할 것인가?
- 데이터 근원지에서 릴레이션에 대한 갱신은 반드시 데이터 웨어하우스로 전파 되어야 함.
- 데이터 웨어하우스의 릴레이션이 데이터 근원지와 완전히 일치한다면 전파 작업은 명백하다.
● 요약 데이터의 선정 여부
참고 자료
없음