본문 바로가기

도서 소개

데이터 과학자, 무엇을 배울 것인가: 빅 데이터 시대의 데이터 과학자 양성 독본

 

그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다.

[2015년 세종도서 우수학술도서 선정!]

데이터 과학자를 꿈꾸는 사람들을 위한 최적의 입문서!

21세기의 가장 섹시한 직업, 데이터 과학자 양성을 위한 필수 기초지식 수록! 

 

출판사 제이펍

원출판사 技術評論社(기술평론사)

원서명 データサイエンティスト養成読本(원서 ISBN: 9784774158969)

저자명 사토 히로유키 외 11인

역자명 정인식

출판일 2014년 6월 30일

페이지 316쪽

시리즈 (없음)

판  형 46배판 변형(188*245*19)

제  본 무선(soft cover)

정  가 24,000원

ISBN 978-89-94506-97-5 (93000)

키워드 빅 데이터, 데이터 사이언티스트, 데이터베이스, R 언어, RStudio, Python, 기기계학습, 머신러닝, 데이터 마이닝, Fluentd, SQL, 웹 스크래핑

분  야 프로그래밍 / 빅 데이터 / 데이터베이스

 

관련 사이트

아마존 도서소개 페이지

원출판사 도서소개 페이지

 

관련 포스트

■ 2014/06/17 - [출간전 책소식] - 데이터 과학자 양성을 위한 가이드가 출간됩니다.

 

관련 시리즈

■ (없음)

 

관련 도서

빅 데이터, 어떻게 활용할 것인가: 오라일리 심층 보고서

머신 러닝 인 액션: 기계 학습 알고리즘으로 데이터 마이닝하기

세븐 데이터베이스: 만들면서 파악하는 NoSQL

MongoDB 인 액션: 빅 데이터 시대 최고의 NoSQL 데이터베이스

 

관련 파일 다운로드(소스 코드와 예제 데이터)

데이터과학자무엇을배울것인가_SampleCodeFiles_20140630.zip
다운로드

 

강의 자료

■ 교재로 채택하신 분들에게는 강의교안(ppt) 및 강의교안을 직접 제작하는 데 도움이 되도록 본문 이미지 자료(번역서)를 보내드리도록 하겠습니다(출판사로 메일이나 전화로 연락주세요). 
강의교안 샘플: 

데이터과학자무엇을배울것인가_강의교안샘플.zip
다운로드

 

 

샘플 PDF(차례, 역자 머리말, 베타리더 후기, 1장 데이터 과학자에 필요한 스킬, 2장 데이터 과학자의 프로세스, 찾아보기)

데이터과학자무엇을배울것인가_sample.pdf
다운로드

 

정오표 페이지

■ (등록되는 대로 링크를 걸어드리겠습니다)

 

 

도서구매 사이트(가나다순)

[강컴]   [교보문고]   [도서11번가]   [반디앤루니스]   [알라딘]   [예스이십사]   [인터파크]

 
도서 소개
데이터 과학자를 꿈꾸는 사람들을 위한 최적의 입문서!
21세기의 가장 섹시한 직업, 데이터 과학자 양성을 위한 필수 기초지식 수록! 
 
현대 사회는 데이터의 홍수 속에 있다고 해도 과언이 아닐 것이다. 이렇게 방대한 데이터들이 정보로서의 가치를 지니게 되려면 서로 어떠한 관계를 형성하고 있는지, 그리고 어떠한 규칙성이 있는지를 찾아내야만 한다. 그래서 데이터가 정보로서의 가치를 갖게 된다면, 이를 통해 미래에 대한 예측이 가능할 수도 있을 것이다. 데이터를 통해 현재를 분석하고 미래를 예측할 수 있는 능력을 갖춘 데이터 과학자를 필요로 하는 시대가 온 것이다.
 
데이터 과학자는 말 그대로 통계학과 전산학을 이용하여 데이터를 분석해서 알고 싶은 정보를 밝혀내는 일을 하는 사람이다. 이 책은 R 언어를 이용한 데이터 파악, 시각화, 그리고 실제 마케팅 분석 사례를 통해 데이터 과학자의 업무를 소개하고 있다. 또한, 데이터 분석을 위한 Python(파이썬)의 기계 학습과 데이터 마이닝 및 여러 알고리즘에 대해서도 다루고 있다. 
 
이 책에서 배우는 주요 내용은 다음과 같다.
 
데이터 과학자의 업무 기술
  • 데이터 과학자에 필요한 스킬
  • 데이터 과학자의 프로세스
  • 빅 데이터 인프라 입문
 
데이터 분석 실천 입문
  • R 언어로 통계 해석을 시작하자
  • 데이터 과학자 지식
  • RStudio로 간편하게 데이터 분석하기
  • Python을 이용한 기계 학습
  • 데이터 마이닝에 필요한 10가지 알고리즘
 
마케팅 분석 본격 입문
  • R 언어에 의한 마케팅 분석
  • 믹시의 대규모 데이터 마이닝 사례
  • 소셜 미디어 네트워크 분석
 
데이터 분석을 위한 필수 기초 지식
  • SQL 입문
  • 웹 스크래핑 입문
 
저자 소개
사토 히로유키(佐藤 洋行)
하라다 히로우에(原田 博植)
시모다 노리히로(下田 倫大)
기무라 슌야(木村 俊也)
오나리 히로코(大成 弘子) 
오쿠노 아키히로(奥野 晃裕)
나카가와 테이토(中川帝人)
하시모토 타케히로(橋本 武彦)
사토 요헤이(里 洋平)
와다 카즈야(和田 計也)
하야카와 아츠시(早川 敦士)
쿠라하시 잇세이(倉橋 一成) 
 
역자 소개
정인식 
숭실대학교에서 전자계산학을 전공하였다. 사회 초년생 시절 자바에 심취해 현대정보기술에서 웹 애플리케이션 개발을 하였고, 그 후 이동통신 단말기 분야로 전직하여 휴대전화 단말기의 부가서비스 개발 업무를 담당하였다. 일본 키스코(주) 모바일사업부 팀장을 역임하면서 일본 교세라의 북미향 휴대전화기 개발에 참여하였고, 현재 일본에서 가나안 솔루션즈의 공동 창업자이자 시스템 엔지니어로 일하고 있다. 옮긴 책으로는 《기초를 다지는 최신 웹 개발 공략서》, 《자바스크립트 라이브러리 실전 활용(엄선 111)》, 《모바게를 지탱하는 기술》, 《데이터베이스를 지탱하는 기술》, 《머리에 쏙쏙 들어오는 jQuery 입문》, 《자바스크립트 마스터북》, 《좋은 코드를 작성하는 기술》 등이 있다.
 
차례
권두 기획 | 데이터 과학자의 업무 기술: 스킬 세트, 데이터 분석 프로세스, 빅 데이터를 취급하는 방법 .. 1
Chapter 01 | 데이터 과학자에 필요한 스킬: 데이터에 스토리를 말하게 해볼까? 2
일본에서의 빅 데이터 원년 2
비즈니스 데이터 분석의 역사 5
고객도, 범인도 빠져나갈 수 없다 8
의사결정을 위한 움직임(활동) 11
필요로 하는 스킬들 14
미래의 데이터 과학자는 어디에 있을까? 17
정리 18
더보기
Chapter 02 | 데이터 과학자의 프로세스: 비즈니스 성과를 의식한 분석 방법 19
시작에 앞서 19
데이터 가공의 흐름 24
데이터 과학자가 성공하는 조건 27
데이터 과학 실패의 본질 29
정리 31
 
Chapter 03 | 데이터 핸들링을 위한 “빅 데이터 인프라” 입문 32
대량의 데이터를 고속으로 계산할 수 있는 시대 32
데이터베이스 33
데이터베이스의 종류 35
데이터베이스와의 접속 38
데이터 분석 기술 39
데이터베이스와 분석 40
데이터 과학 Loves 빅 데이터 43
정리 44
 
column | 스킬의 표준화와 캐리어 형성을 위한 데이터 과학자 협회의 활동 45
설립 배경 45
협회의 개요 46
협회의 활동 48
데이터 과학자 협회의 조직과 운영 48
데이터 과학자의 스킬 표준(DSSS)에 대하여 49
 
특집 ❶ | 데이터 분석 실천 입문: 데이터 과학자로의 첫걸음 .. 53
Chapter 01 | R 언어로 통계 분석을 시작하자: 데이터의 파악, 시각화와 다변량 분석 54
시작하며 54
R 언어의 도입 54
데이터 파악 56
다변량 분석: 예측 63
다변량 분석: 분류 72
기계 학습 79
정리 83
 
Chapter 02 | 데이터 과학자 필수 지식: 엔지니어에 필요한 데이터 분석 지식 84
시작하며 84
데이터 분석 소프트웨어 84
데이터의 취득 86
데이터의 클린징 93
데이터 분석 99
정리 112
 
Chapter 03 | RStudio로 간편하게 데이터 분석하기: R 언어를 좀 더 편리하게 사용할 수 있는 통합 개발환경 113
시작하며 113
RStudio를 사용해 보자 114
Reproducible Research의 추천 123
한 발짝 앞선 RStudio 활용법 130
RStudio Server를 사용해 보자 132
정리 136
 
Chapter 04 | Python을 이용한 기계 학습: 풍부한 라이브러리를 활용한 데이터 분석 137
시작하며 137
정리 163
Chapter 05 | C4.5/k-means/서포트 벡터 머신/아프리오리/ EM 등
데이터 마이닝에 필요한 10가지 알고리즘 164
시작하며 164
정리 173
 
특집 ❷ | 스킬 업을 위한 마케팅 분석 본격 입문 .. 175
Chapter 01 | R 언어를 이용한 마케팅 분석: 데이터 과학을 적용한 광고 전략과 사이트 개선 176
시작하며 176
포지셔닝 전략 세우기 176
광고 전략 세우기 186
웹 사이트를 개선하여 매출 높이기 193
 
Chapter 02 | 믹시의 대규모 데이터 마이닝 사례: 타기팅 광고 리플레이스의 포인트 공개 203
시작하며 203
구 인터레스트 타기팅 206
신 인터레스트 타기팅 211
정리 221
 
Chapter 03 | 마케팅에 유용한 소셜 미디어 네트워크 분석 222
시작하며 – 소셜 네트워크 분석이란? 222
기본 개념에 대한 정의 223
소셜 네트워크의 특징량 계산 227
소셜 네트워크 분석을 마케팅에 활용해 보자 230
정리 235
 
특별 기사 | Fluentd 입문: 실시간 로그 수집으로 로그 해석을 스마트하게 236
Fluentd란? 236
사용법 244
Fluentd 활용 방법 248
사례 소개 253
정리 262
 
특별 기획 | 데이터 분석을 위한 필수 기초 지식 .. 263
Chapter 01 | SQL 입문: 관계형 데이터베이스 조작에 필요한 언어 264
기초편 264
실전편 269
정리 281
 
Chapter 02 | 웹 스크래핑 입문: 웹 사이트로부터 정보를 수집하는 기술 282
시작하며 282
웹 스크래핑을 시작하기 전에 282
웹 스크래핑에 이용할 수 있는 모듈 283
urllib2에 의한 리소스 데이터의 취득 284
BeautifulSoup에 의한 리소스 데이터의 검색과 취득 288
lxml에 의한 xPath 대응 요소의 취득 293
정리 295
 
찾아보기 296