[방송통신대 컴퓨터과학과] 빅데이터의이해-중간과제물
해솔
다운로드
장바구니
과제정보
학과 | 컴퓨터과학과, 통계·데이터과학과 | 학년 | 4학년 |
---|---|---|---|
과목명 | 빅데이터의이해 | 자료 | 9건 |
공통 |
1. 다음을 설명하시오.(6점)
(1) 빅데이터의 출현배경 (2) 데이터과학 2. 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미있는...
1. 다음을 설명하시오.(6점)
(1) 빅데이터의 출현배경 (2) 데이터과학 2. 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미있는 여러 개를 지정) (6점). 3. 다음을 기술하시오(12점). (1) 구글 Ngram을 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고 그 의미를 정리하시오. (2) 구글 트렌드를 이용하여 (1)에서 찾은 동일 키워드(영어) 3개를 찾아 그래프를 작성하고 이를 (1)의 결과와 연계해서 비교하여 설명하시오. 4. 국내외 기업, 정부에서 빅데이터를 이용하여 얻은 최신 혁신성과 사례를 발굴하고 이를 정리하시오.(6점) |
소개글
"[방송통신대 컴퓨터과학과] 빅데이터의이해_중간과제물"에 대한 내용입니다.목차
1. 용어 설명22. 네이버 트렌드를 이용하여 검색 주제어 비교4
3. 구글 Ngram을 이용하여 1900년대 이후 키워드 비교3
4. 구글 트렌드를 이용하여 동일 키워드 비교4
5. 국내외 기업, 정부에서 빅데이터를 이용하여 얻은 혁신성과 사례 정리5
6. 참고문헌6
본문내용
1. 용어 설명● 빅데이터의 출현 배경
- 출현 배경은 크게 데이터 부화량 증대, 개인 인프라 구축, 오픈 소스의 활성화로 생각되며 자세한 내용은 다음과 같다.
- 즉 데이터 부하량의 경우 다양한 분야에서 다양한 형태로 많은 양의 데이터를 증가로 인해 복잡성이 증가하고 있다. 이 뿐만 아니라 데이터 부화량도 커짐으로써 빅데이터 시대가 출현하였다.
- 최근 디지털 기술 (디스크 등 기기들의 성능 개선)의 발전으로 낮은 비용으로 일반 사용자도 손쉽게 데이터를 저장해서 활용할 수 있는 인프라를 구축할 수 있다.
- 무엇보다도 기술적 배경으로서 분산 처리 및 다양한 연산 기술의 오픈 소스의 역할이 크다. 즉 고가의 소프트웨어 비용 때문에 전문가만 할 수 있었던 데이터 분석을 일반 기업 및 사용자에서도 수월하게 할 수 있다.
● 데이터과학
- 구조적 데이터 (정해진 서식에 따라 특정 형식을 갖춘 데이터)와 달리 다양한 분야에서 다양한 형태로 많은 양의 데이터를 이용하여 분석/가공하여 각 분야에서 활용할 수 있는 유의미한 결과를 도출한다. 이 과정에서 가공하는 코딩 능력뿐만 아니라 의미있는 결론을 끌어낼 수 있는 통계 해석이 요구된다.
Ⅱ. 네이버 트렌드를 이용하여 검색 주제어 비교
● 주제어 1 : 폭염 (일사병, 일사병, 온열질환, 열대야)
● 주제어 2 : 한파 (한랭질환, 꽃샘추위, 한파주의보, 동상)
● 기간 : 2016년 01월 01일 – 2019년 12월 31일
● 범위 : 전체
● 성별 : 전체
● 연령 : 전체
- 검색 조건 (폭염/한파 키워드, 기간, 범위, 성별 그리고 연령)에 따라 키워드 조회수를 시각화하였다 (그림 1 참조).
- 그 결과 폭염 및 한파의 경우 각각 여름철 (6-9월) 및 겨울철 (12-3월)에서 많은 빈도를 보였다.
- 특히 2018년 겨울철 한파는 “17년만에 찾아온 서울의 혹한”으로서 최저 기온 (16.3-17.0 ℃)의 기록적인 한파로 인해 최고 조회수를 차지하였다.