[직접 작성] 방송통신대학교 컴퓨터과학과 빅데이터의 이해 2020년 2학기 중간과제물
*종*
다운로드
장바구니
과제정보
학과 | 컴퓨터과학과, 통계·데이터과학과 | 학년 | 4학년 |
---|---|---|---|
과목명 | 빅데이터의이해 | 자료 | 9건 |
공통 |
1. 다음을 설명하시오.(6점)
(1) 빅데이터의 출현배경 (2) 데이터과학 2. 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미있는...
1. 다음을 설명하시오.(6점)
(1) 빅데이터의 출현배경 (2) 데이터과학 2. 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미있는 여러 개를 지정) (6점). 3. 다음을 기술하시오(12점). (1) 구글 Ngram을 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고 그 의미를 정리하시오. (2) 구글 트렌드를 이용하여 (1)에서 찾은 동일 키워드(영어) 3개를 찾아 그래프를 작성하고 이를 (1)의 결과와 연계해서 비교하여 설명하시오. 4. 국내외 기업, 정부에서 빅데이터를 이용하여 얻은 최신 혁신성과 사례를 발굴하고 이를 정리하시오.(6점) |
소개글
"[직접 작성] 방송통신대학교 컴퓨터과학과 빅데이터의 이해 2020년 2학기 중간과제물"에 대한 내용입니다.목차
1. 다음을 설명하시오.(6점)(1) 데이터과학
2. 다음에 대해 답하시오.(18점)
(1) 네이버 트렌드를 이용하여 비교가능한 검색 주제어 2개를 비교하고 그래프로 정리하어 의미있는 결론을 도출하여 기술하시오(주제어별 키워드는 의미있는 여러 개를 지정).
(2) 구글 Ngram을 이용하여 1900년대 이후 관련 있는 키워드(영어) 3개를 찾아 그래프로 정리하고 그 의미를 정리하시오.
(3) 구글 트렌드를 이용하여 (2)에서 찾은 동일 키워드(영어) 3개를 찾아 그래프를 작성하고 이를 (2)의 결과와 연계해서 비교하여 설명하시오.
3. 기업, 정부에서 빅데이터를 이용하여 얻은 최신 성과 사례를 발굴하고 이를 정리하시오.(6점)
(1) 경상북도 교육청, 빅데이터 활용한 학교 맞춤형 FAQ (투명성, 효율성, 혁신성 1위)
(2) 서울시 자원봉사 센터, 온라인 플랫폼 통한 자원봉사 활성화 (투명성 2위)
(3) 정보통신 정책 연구원, 통계 보급/이용 활성화 우수기관(참여 1위)
(4) 병무청, 병역 기피자 공개를 통한 공정 병역 문화 확산(투명성 1위)
(5) 도로교통공단, 빅데이터로 안전 확보(참여 2위)
(6) 한국 문화 예술 위원회(투명성 1위)
4. 총평
본문내용
데이터 과학이란 무엇인가?데이터과학이란 보통 큰 데이터셋에 대해 어노테이션, 클리닝, 핸들링, 저장, 분석을 하여 그로부터 유용한 지식을 추출하는 것을 말한다. 이는 Informatics와 비슷하다. Informatics 란 정보학으로 모든 데이터를 처리 분석하여 유용한 정보를 얻는 것이다. 보통 큰 데이터셋에 대해 어노테이션, 클리닝, 핸들링, 저장, 분석을 하여 그로부터 유용한 지식을 추출하는 것을 말한다. 이는 Informatics와 비슷하다. Informatics 란 정보학으로 모든 데이터를 처리 분석하여 유용한 정보를 얻는 것이다. 그럼 Informatics와 data science의 차이점은 무엇인가? 첫째, 데이터과학자는 컴퓨터 메모리에 올라가지 않은 수준의 빅데이터를 다룬다. 둘째, 데이터과학자는 메타데이터 및 large-scale annotation이 필요하며, 데이터의 noise가 어디에서 발생되었는지에 대해 설명할 수 있어야 한다. 이는 도메인에 대한 이해를 필요로 하며 단지 데이터를 정리하고 가공하는 것과는 다르다. 셋째, 이러한 빅데이터를 분석할 수 있는 방법론인 머신러닝, 딥러닝 등을 이해하고 이를 해당 분야의 데이터에 적용시켜 유용한 가치를 찾는다. 최근 많은 학교 교육 및 직업 교육에서 domain-free 데이터과학을 가르친다. 금융, 헬스, 생물 어떤 분야에도 통용할 수 있는 데이터 처리 기술이다. 물론 그것은 데이터 과학을 시작할 수 있는 "기초 단계"로서 유용하다. 하지만 단지 domain-free 데이터 과학만을 배우면 단지 데이터를 가공하고 매니지하는 사람에 그쳐버릴 수도 있다. 하지만 domain에 대한 specific knowledge가 있으면 그 분야에 전문가이면서 데이터를 직접 처리하고 가공, 분석 할 수 있는 사람이 될 수 있다. 데이터과학자에게 도메인 지식이 필수적인 이유는 다음과 같이 정리해볼 수 있다.
참고 자료
https://statkclee.github.io/data-science/ds-education.htmlhttps://3months.tistory.com/330
http://www.goldenplanet.co.kr/blog/2018/04/24/데이터과학-빅데이터-데이터분석/
What is Biomedical Data Science and Do We Need an Annual Review of It ? - Annual review of biomedical data science, 2018
한국정보화진흥원(2013), ‘새로운 미래를 여는 빅데이터 시대’
위키백과, ‘빅 데이터’
M. Cox & D. Ellsworth(1997), ‘Application-controlled demand paging for out-of-core visualization’
R. Wang & Insider Associates, LLC(2011), ‘The Three V’s of Big Data’
한국산업기술진흥원(2012), ‘IT시대의 빅뱅 대세는 빅데이터다’
한국정보화진흥원(2012), ‘빅데이터로 진화하는 세상’
정재호(2006), ‘미래예측방법론 : 이론과 실제’
IT daily(2013), ‘빅데이터는 사람들의 마음을 읽어 미래를 예측하는 것’
블로터닷넷(2011), ‘빅데이터 분석이 세상을 바꾼다’
방송통신위원회(2013), ‘당신의 이야기-빅데이터가 만드는 사회’
http://www.diabetes.or.kr/new_workshop/201403/ab3.html
https://blog.uplus.co.kr/1704?category=648823
https://blog.naver.com/youngdisplay/60188375044
https://m.post.naver.com/viewer/postView.nhn?volumeNo=22548451&memberNo=35871176&vType=VERTICAL
https://m.post.naver.com/viewer/postView.nhn?volumeNo=17767310&memberNo=33264526&vType=VERTICAL
https://blog.naver.com/businessinsight/221594106470