빅데이터 분석기술 하둡의 이해(Understanding Hadoop BigData analytics technology)
- 최초 등록일
- 2015.11.09
- 최종 저작일
- 2014.08
- 23페이지/ 한컴오피스
- 가격 3,000원
목차
Ⅰ. 서론
Ⅱ. 빅데이터 분석기술 – 하둡(Hadoop)
1. 하둡 소개
2. 등장배경
3. 역사 및 발전과정
Ⅲ. 하둡의 구성요소와 구조
1. 분산 파일 시스템
(1) 마스터 노드(Master Node)
(2) 슬레이브 노드(Slave Node)
2. 하둡의 구성요소
(1) 하둡 분산파일시스템(HDFS)
(2) 맵 리듀스(MapReduce)
3. 하둡의 구조
Ⅳ. 하둡의 핵심구성요소
1. 하둡 분산 파일 시스템(HDFS)
(1) 하둡 분산파일시스템의 설계
(1) 하둡 분산파일시스템의 전체구조
(2) 네임노드(NameNode)
(3) 세컨더리 네임노드(Secondary NameNode)
(4) 데이터 노드(DataNode)
2. 맵 리듀스(MapReduce)
(1) 맵 리듀스의 설계
(1) 맵 리듀스의 전체구조
(2) 잡 트래커(Job Tracker)
(3) 태스크 트래커(Task Tracker)
Ⅴ. 하둡의 활용사례
1. KT 활용사례
2. GS샵 활용사례
3. Yahoo Japan 활용사례
Ⅵ. 참고문헌
본문내용
Ⅰ. 서론
“앞으로 양질의 콘텐츠는 빅 데이터를 어떻게 가공하느냐에 달려있다.”
벌써 오래 전부터 콘텐츠는 대부분의 서비스와 제품에서 가장 중요한 필수 요소로 여겨져 왔다. 예를 들어, 최근에 출시한 구글TV는 훌륭한 제품이라기 보다 유투브라는 풍부한 콘텐츠가 있기 때문에 고객으로부터 큰 관심을 끌고 있다. 물론 제품 자체도 기본적으로 잘 구성되어 있지만 핵심은 콘텐츠임이 맞다.
그런데 문제는 인터넷 기술이 급속도로 발전함에 따라 콘텐츠를 구성하는 데이터의 양이 기하급수적으로 증가하고 있다는 것이다. 우리는 이렇게 늘어나고 있는 데이터를 빅데이터라 부르며, 일반적으로 양질의 콘텐츠가 얼마나 데이터를 잘 가공하느냐에 있다고 봤을 때, 방대하게 늘어나는 데이터를 잘 가공하기 위한 소프트웨어 기술이 반드시 필요하다.
우리가 좋아하는 유투브 서비스들은 이미 수년 전부터 이러한 고민을 해왔고, 서비스 플랫폼을 적용하여 수천만 개의 동영상 속에서 고객의 성향을 찾아내어 적절히 추천하고 필터링하는 등의 작업을 거쳐 양질의 콘텐츠를 고객들에게 서비스하고 있다. 바로 이러한 작업들을 쉽게 할 수 있도록 하는 것이 오픈소스 하둡과 같은 소프트웨어 프로그램이다.
이제부터 빅데이터 분석기술인 하둡의 이해를 위해 하둡의 역사 및 발전과정을 알아보고 빅데이터 플랫폼 하둡의 구조 및 핵심구성요요, 하둡 아키텍쳐의 기본개념에 대해 이해하며, 현재 국내외 기업들에서 적용하고 있는 하둡의 활용사례를 살펴보고자 한다.
Ⅱ. 빅데이터 분석기술 – 하둡(Hadoop)
1. 하둡 소개
하둡은 대량의 자료를 처리할 수 있는 큰 컴퓨터 클러스터에서 동작하는 분산 응용 프로그램을 지원하는 오픈소스 자바 소프트웨어 프레임워크이다. 원래 웹 검색엔진 너치의 분산 처리를 지원하기 위해 개발된 것으로, 아파치 루씬의 하부 프로젝트이다. 분산처리 시스템인 구글 파일 시스템을 대체할 수 있는 하둡 분산 파일 시스템(HDFS: Hadoop Distributed File System)과 맵 리듀스(MapReduce)를 구현한 것이다.
참고 자료
위키피디아 백과사전(http://ko.wikipedia.org/wiki/%ED%95%98%EB%91%A1)
아파치 하둡 홈페이지(http://hadoop.apache.org)
Hadoop & NoSQL: 대용량 데이터 분석 및 처리를 위한 | 서상원 외 4명 | (주)도서출판길벗 | 2013
빅데이터 하둡 플랫폼의 활용 | 이현종 | 한국통신학회지 | 2012
하둡 기반 빅 데이터 처리 플랫폼 통합 연결 인터페이스 | 김용길 외 2명 | 한국정보기술학회지 | 2013
하둡과 맵리듀스 | 박정혁 외 3명 | 한국데이터정보과학회지 | 2013
하둡 기반 빅데이터 영상 처리를 통한 차량 이동경로 추적 시스템의 설계 및 구현 | 양성은 외 2명 | 디지털콘텐츠학회지 | 2013
하둡 기반 천문 응용 분야 대규모 데이터 분석 기법 | 곽재혁 외 4명 | 한국컴퓨터종합학술대회지 | 2011
GSshop – 하둡 기반 빅데이터 분석 플랫폼 | 공개SW포털 | 2012
빅데이터 분석 기술과 활용사례 | 김재생 | 한국콘텐츠학회 | 2013
KT, 하둡 기반의 빅데이터 플랫폼 구축으로 비용 절감 ‘alleh’ | IDG Korea | 2013
아파치 하둡으로 구현하는 빅데이터 | 김병곤 | 한국데이터베이스진흥원 | 2012
네이버블로그(http://sqlmvp.kr/140199566188)