《구글을 지탱하는 기술》의 저자가 근 10년 만에 들고 온 역작!
현대 비즈니스의 성패는 데이터 수집과 통합, 그리고 처리 방법에 달렸다!
데이터 처리 전문가가 알려주는 빅데이터와 관련 기술의 모든 것!
출판사 제이펍
저작권사 技術評論社
원서명 ビッグデータを支える技術(원서 ISBN: 9784774192253)
저자명 니시다 케이스케
역자명 정인식
출판일 2018년 11월 5일
페이지 312쪽
시리즈 (없음)
판 형 크라운판 변형(170*225*21)
제 본 무선(soft cover)
정 가 27,000원
ISBN 979-11-88621-43-9(93000)
키워드 데이터 과학 / 빅데이터/ big data / 지탱하는 기술
분야 데이터베이스 / 빅데이터
도서 소개
현대 비즈니스의 성패는 데이터 수집과 통합, 그리고 처리 방법에 달렸다!
데이터 처리 전문가가 알려주는 빅데이터와 관련 기술의 모든 것!
'데이터 처리를 어떻게 시스템화할 것인가?' 이 책에서는 이와 같은 엔지니어링 문제를 중심으로 일련의 데이터 처리에 필요한 요소와 기술을 정리하고, 데이터를 효율적으로 처리하기 위한 토대를 만들고, 그 위에서 시스템의 자동화를 지원하는 다양한 기술을 다룬다.
컴퓨터의 성능이 향상됨에 따라 머신러닝을 필두로 데이터를 활용하는 시스템 개발에 관한 기대가 더욱더 커지고 있다. 따라서 앞으로는 시스템 규모에 상관없이 '데이터 처리 그 자체를 시스템의 일부로 하는 기술'에 대한 수요가 점차 많아질 것이다. 이 책에서 소개하는 다양한 시각 자료와 체계적인 관련 기술 소개는 독자들의 빅데이터 입문에 많은 도움이 될 것이다.
지은이 소개
니시다 케이스케(西田圭介)
1976년 일본 효고현에서 태어났다. 트레저 데이터에 근무하고 있으며, 저서로는 《구글을 지탱하는 기술》(김성훈 옮김, 멘토르, 2008)이 있다.
옮긴이 소개
정인식
숭실대학교에서 전자계산학을 전공하였다. 사회 초년생 시절 자바에 심취해 현대정보기술에서 웹 애플리케이션을 개발하였고, 그 후 이동통신 단말기 분야로 옮겨 휴대전화 단말기의 부가서비스 개발 업무를 진행하였다. 그리고 일본 키스코 모바일사업부의 팀장을 거쳐, 일본 교세라의 북미향 휴대전화기 개발에 참여하였다. 지금은 일본의 주요 이동통신사에서 업무 프로세스 개선을 위한 IT 컨설팅 및 데이터 분석 관련 도구를 개발하고 있다. 또한, 《자바 마스터 북: 기초에서 실무 응용까지》, 《자바스크립트 마스터 북(제2판)》을 비롯해 10여 종의 책을 번역하였다.
차례
CHAPTER 1 빅데이터의 기초 지식 _ 1
1-1 [배경] 빅데이터의 정착 3
분산 시스템에 의한 데이터 처리의 고속화 ― 빅데이터의 취급하기 어려운 점을 극복한 두 가지 대표 기술 3
분산 시스템의 비즈니스 이용 개척 ― 데이터 웨어하우스와의 공존 7
직접 할 수 있는 데이터 분석 폭 확대 ― 클라우드 서비스와 데이터 디스커버리로 가속하는 빅데이터의 활용 8
1-2 빅데이터 시대의 데이터 분석 기반 11
[재입문] 빅데이터의 기술 ― 분산 시스템을 활용해서 데이터를 가공해 나가는 구조 11
데이터 웨어하우스와 데이터 마트 ― 데이터 파이프라인 기본형 16
데이터 레이크 ― 데이터를 그대로 축적 17
데이터 분석 기반을 단계적으로 발전시키기 ― 팀과 역할 분담, 스몰 스타트와 확장 19
데이터를 수집하는 목적 ― ‘검색’, ‘가공’, ‘시각화’의 세 가지 예 22
확증적 데이터 분석과 탐색적 데이터 분석 25
1-3 [속성 학습] 스크립트 언어에 의한 특별 분석과 데이터 프레임 26
데이터 처리와 스크립트 언어 ― 인기 언어인 파이썬과 데이터 프레임 26
데이터 프레임, 기초 중의 기초 ― ‘배열 안의 배열’로부터 작성 27
웹 서버의 액세스 로그의 예 ― pandas의 데이터 프레임으로 간단히 처리 28
시계열 데이터를 대화식으로 집계하기 ― 데이터 프레임을 그대로 사용한 데이터 집계 30
SQL의 결과를 데이터 프레임으로 활용하기 31
1-4 BI 도구와 모니터링 33
스프레드시트에 의한 모니터링 ― 프로젝트의 현재 상황 파악하기 33
데이터에 근거한 의사 결정 ― KPI 모니터링 35
변화를 파악하고 세부 사항을 이해하기 ― BI 도구의 활용 37
수작업과 자동화해야 할 것의 경계를 판별하기 39
1-5 요약 42
더보기
'제이펍의 도서' 카테고리의 다른 글
하이퍼레저 패브릭으로 배우는 블록체인 (0) | 2018.12.02 |
---|---|
모두를 위한 리눅스 프로그래밍: 리눅스 구조와 C 언어로 배우는 리눅스 첫걸음 (2) | 2018.11.21 |
빅데이터를 지탱하는 기술 (0) | 2018.11.06 |
심층 학습(Deep Learning) (2) | 2018.10.29 |
백설공주 거울과 인공지능 이야기: 볼츠만 머신러닝에서 딥러닝까지 (0) | 2018.10.29 |
카프카 핵심 가이드: 실시간 데이터와 스트림 프로세싱 (0) | 2018.10.25 |
댓글을 달아 주세요