171030-데이터마이닝
- 최초 등록일
- 2018.01.22
- 최종 저작일
- 2017.12
- 7페이지/ MS 워드
- 가격 1,500원
목차
없음
본문내용
1. 1장 연구과제 4번
지도학습과 자율학습의 차이를 설명하고 어떤 데이터마이닝 기법들이 포함되는지 설명하라.
1) 지도학습 : 지도학습의 목표는 입출력 간의 관계를 결정하는 시스템에 대한 유용한 근사 시스템을 구하는 것으로 정의할 수 있다. 지도학습에서의 교사의 역할은 실제 종속변수의 값이 수행하게 된다.
대표적인 지도학습으로는 회귀 및 분류가 있는데, 회귀와 분류는 입력 및 목표변수의 값을 이용하여 주어진 입력변수에 대한 목표변수의 값을 예측하는 모형을 개발한다는 점에서 유사하다. 회귀의 경우 목표변수가 연속형이며, 분류는 범주형이라는데 그 차이가 있다.
회귀분석은 회귀분석, 최근접이웃기법, 신경망, 평활법 등이 있으며, 분류분석은 판별분석, 로지스틱회귀분류, 최근접이웃기법, 의사결정나무, 나이브베이즈분, 신경망, 평활법 등이 있다.
2) 자율학습 : 자율학습에서는 교사의 역할에 해당하는 실제 출력값이 존재하지 않는다. 때문에 자율학습에서는 입출력간의 관계를 결정하는 시스템을 찾기보다는 데이터에 존재하는 여러가지 형태의 특징을 찾는데 그 목표를 둔다. 즉 입력된 변수간의 관계를 탐색적으로 분석하여 정보를 추출하는 기법이다.
대표적인 자율학습으로는 군집분석, 연관성분석, 가중치결정이 있다. 군집분석은 K-평균, 계층적 군집분석, 유한혼합모형, 이중군집법 등이 있으며, 연관성분석은 장바구니분석, 서열분석, 트랜잭션 데이터분석 등이 있다. 가중치 결정은 신경망 등이 이에 속한다.
최근에는 지도학습 및 자율학습 어느 한쪽으로 뚜렷하게 구분하기 어려운 기법이 많이 개발되고 있는데, 이를 비정형분석이라하며 텍스트마이닝, 사회연결망 분석 등이 있다.
참고 자료
없음