데이터 전처리 방법
- 최초 등록일
- 2022.05.31
- 최종 저작일
- 2022.05
- 6페이지/ MS 워드
- 가격 3,000원
소개글
"데이터 전처리 방법"에 대한 내용입니다.
목차
I. 서론
II. 본론
1. 전처리
2. 특징변환의 필요성
3. 특징(Feature)변환
4. 목표변환
5. 결측값 대체(Imputation)
6. 특징공학
7. ROCKET
8. Shapelets
III. 결론
IV. 참고문헌
본문내용
I. 서론
데이터 분석 작업에 있어 전처리는 매우 중요한 작업이다. 특히나 시계열 데이터의 경우 본래의 특성으로 인하여 전처리 작업에 매우 유의해야 한다. 본 보고서에서는 시계열 데이터에 대한 전처리의 일환으로 특징 변환, 특징 공학측면에서 사용가능한 다양한 방법에 대해서 알아보도록 하겠다.
II. 본론
1. 전처리
1) 정의
- 실제 데이터는 지저분한데 이를 대상으로 클리닝 작업을 수행하는 것을 말한다.
2) 목표
- 특징의 예측 능력을 높이도록 한다.
- 해당 기계학습 모델의 예측 성능을 향상시키는 것을 목표로 한다.
3) 데이터 품질
- 정확도 : 측정값의 경우 정확도가 보장되어야 한다.
- 완결성 : 결측치가 없어야 한다.
- 일관성 : 동일한 입력에 대해 동일한 결과가 나와야 한다.
4) 전처리를 위한 적용기술
(1) 특징 변환
- 기계학습 알고리즘의 가정에 맞게 조정하는 작업
-> 단변량 특징 변환, 다변량 특징 변환(변수 선택, 차원감소)
- 스케일링, 자승/로그변환, 결측값 대체
(2) 특징 엔지니어링
- 여러 기본 특징을 이용하여 보다 복잡한 특징으로 구성
참고 자료
Ben Auffarth(2021), Machine Learning for Timeseries with Python, Packt