현대 사회는 데이터의 홍수 속에 있다고 해도 과언이 아닐 것이다. 이렇게 방대한 데이터들이 정보로서의 가치를 지니게 되려면 서로 어떠한 관계를 형성하고 있는지, 그리고 어떠한 규칙성이 있는지를 찾아내야만 한다. 그래서 데이터가 정보로서의 가치를 갖게 된다면, 이를 통해 미래에 대한 예측이 가능할 수도 있을 것이다. 데이터를 통해 현재를 분석하고 미래를 예측할 수 있는 능력을 갖춘 데이터 과학자를 필요로 하는 시대가 온 것이다.
데이터 과학자는 말 그대로 통계학과 전산학을 이용하여 데이터를 분석해서 알고 싶은 정보를 밝혀내는 일을 하는 사람이다. 이 책은 R 언어를 이용한 데이터 파악, 시각화, 그리고 실제 마케팅 분석 사례를 통해 데이터 과학자의 업무를 소개하고 있다. 또한, 데이터 분석을 위한 Python(파이썬)의 기계 학습과 데이터 마이닝 및 여러 알고리즘에 대해서도 다루고 있다.
이 책에서 배우는 주요 내용은 다음과 같다.
데이터 과학자의 업무 기술
데이터 과학자에 필요한 스킬
데이터 과학자의 프로세스
빅 데이터 인프라 입문
데이터 분석 실천 입문
R 언어로 통계 해석을 시작하자
데이터 과학자 지식
RStudio로 간편하게 데이터 분석하기
Python을 이용한 기계 학습
데이터 마이닝에 필요한 10가지 알고리즘
마케팅 분석 본격 입문
R 언어에 의한 마케팅 분석
믹시의 대규모 데이터 마이닝 사례
소셜 미디어 네트워크 분석
데이터 분석을 위한 필수 기초 지식
SQL 입문
웹 스크래핑 입문
저자 소개
사토 히로유키(佐藤 洋行)
하라다 히로우에(原田 博植)
시모다 노리히로(下田 倫大)
기무라 슌야(木村 俊也)
오나리 히로코(大成 弘子)
오쿠노 아키히로(奥野 晃裕)
나카가와 테이토(中川帝人)
하시모토 타케히로(橋本 武彦)
사토 요헤이(里 洋平)
와다 카즈야(和田 計也)
하야카와 아츠시(早川 敦士)
쿠라하시 잇세이(倉橋 一成)
역자 소개
정인식
숭실대학교에서 전자계산학을 전공하였다. 사회 초년생 시절 자바에 심취해 현대정보기술에서 웹 애플리케이션 개발을 하였고, 그 후 이동통신 단말기 분야로 전직하여 휴대전화 단말기의 부가서비스 개발 업무를 담당하였다. 일본 키스코(주) 모바일사업부 팀장을 역임하면서 일본 교세라의 북미향 휴대전화기 개발에 참여하였고, 현재 일본에서 가나안 솔루션즈의 공동 창업자이자 시스템 엔지니어로 일하고 있다. 옮긴 책으로는 《기초를 다지는 최신 웹 개발 공략서》, 《자바스크립트 라이브러리 실전 활용(엄선 111)》, 《모바게를 지탱하는 기술》, 《데이터베이스를 지탱하는 기술》, 《머리에 쏙쏙 들어오는 jQuery 입문》, 《자바스크립트 마스터북》, 《좋은 코드를 작성하는 기술》 등이 있다.
차례
권두 기획 | 데이터 과학자의 업무 기술: 스킬 세트, 데이터 분석 프로세스, 빅 데이터를 취급하는 방법 .. 1
Chapter 01 | 데이터 과학자에 필요한 스킬: 데이터에 스토리를 말하게 해볼까? 2