본문 바로가기

데이터분석

빅데이터 입문자를 위한 속이 꽉 찬 서적! 안녕하세요? 오늘 소개할 책은 빅데이터 서적입니다. 《카프카 핵심 가이드》, 《몽고디비 인 액션(제판)》, 《하이 퍼포먼스 스파크》, 《러닝 스파크》와 같이 빅데이터와 연관된 도구나 언어 관련 서적은 간간이 출판해 왔지만, 빅데이터만을 중점적으로 다루는 기술 서적은 처음 출간하는 것 같습니다. 대부분의 사람이 빅데이터라고 하면 '데이터 분석'을 먼저 떠올릴 텐데, 이 책은 데이터 분석 기법은 거의 다루지 않습니다. 이 책의 주제는 처음부터 끝까지 '데이터 처리를 어떻게 시스템화할 것인가', 즉 '데이터 처리의 자동화'에 포커스를 맞추고 있습니다. 데이터 분석가의 업무 중 가장 많은 시간을 차지하면서도 가장 하기 싫은 영역이 바로 데이터 수집과 전처리 과정일 텐데요. (참고: http://www.dodom.. 더보기
빅데이터 분석의 대세 프레임워크, 아파치 스파크 빠르게 사용할 수 있는 데이터 분석 라이브러리, 스칼라나 자바, 파이썬, R 등의 다양한 언어를 지원하며, 이들 언어와 데이터베이스에 대한 기본적인 이해가 있으면 쉽게 사용할 수 있다는 장점 등으로 최근 들어 많은 곳에서 아파치 스파크(Apache Spark)를 이용하고 있는 것 같습니다. 애플이나 페이스북과 같은 거대 IT 기업은 물론, 관공서나 유수의 금융/통신 업체들에서도 이용하고 있다고 합니다. 오픈소스이기 때문에 사용하려는 회사에 맞게 자유롭게 아파치 기반의 분석 인프라룰 구현할 수 있다는 것도 큰 장점인 것 같습니다. 그래서 저희 제이펍도 스파크의 가능성을 보고 스파크의 창시자인 마테이 자하리아와 출륭한 스파크 커미터인 홀든 카로 등이 집필한 《러닝 스파크》를 15년 가을에 출간하였었는데요. .. 더보기
R 전문가를 위한 해들리 위컴의 선물! 해들리 위컴(Hadley Wickham)은 R을 좀 다룰 줄 안다는 분들은 너무나 잘 알고 있는 유명인사죠. R 재단의 핵심 멤버이자 ggplot2, plyr/dplyr, reshape2, rvest과 같은 패키지를 만들었고, R과 관련한 여러 주목할 만한 책을 쓴 저술가이기도 합니다. 그가 쓴 책은 다음과 같은 것들이 있는데요. ggplot2: Elegant Graphics for Data Analysis (Use R!) 2nd ed. (번역서: ggplot2: R로 분석한 데이터를 멋진 그래픽으로)R Packages: Organize, Test, Document, and Share Your Code (번역서: 저희 출판사에서 준비 중에 있습니다. 11월 경에 찾아뵙겠습니다)Advanced R (번역서.. 더보기
R로 배우는 실무 데이터 과학 이 책은 현재 절판입니다. 그간 읽어주신 독자들께 감사드립니다. 2018년 세종도서 학술부문 우수도서 선정!데이터 탐색에서 모델링, 결과 전달에 이르기까지데이터 과학의 모든 프로세스를 담았다! 종이책 구매 사이트(가나다순)[강컴] [교보문고] [도서11번가] [반디앤루니스] [알라딘] [예스이십사] [인터파크] 전자책 구매 사이트(가나다순)[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사] [인터파크] 출판사 제이펍원출판사 MANNING원서명 Practical Data Science with R(원서 ISBN: 9781617291562) 저자명 니나 줌멜, 존 마운트역자명 임대경출판일 2017년 12월 15일페이지 464쪽판 형 46배판변형(188*245*22)제 본 무선(soft cover).. 더보기
데이터 과학의 전체 프로세스를 경험하다! 오늘 소개할 책은 우여곡절이 좀 있는 책인데, 그래도 2017년 안에 출간할 수 있어서 다행입니다. 번역을 제때 끝마쳐 주지 못하셨지만, 바쁜 일정에도 끝까지 마무리를 해주신 임대경 역자님께 먼저 감사의 말씀을 드립니다. 원서(《Practical Data Science with R》)가 출간된 지 3년이라는 시간이 흘렀지만, R을 기반으로 데이터 과학을 다루는 책으로는 최고의 책 중 하나로 평가받고 있습니다. 이 책은 말 그대로 한 권의 책에 데이터 탐색에서 모델링, 결과 전달에 이르기까지 데이터 과학의 모든 프로세스를 담고 있는데요, 시니어 데이터 과학자이자 베이 지역 R 사용자 그룹 공동 설립자인 짐 포르작(Jim Porzak)은 다음과 같은 말로 이 책을 추천해 주었습니다. ※※※※※※※※※※※※※.. 더보기
자바스크립트와 Node.js를 이용한 웹 크롤링 테크닉 이 책은 현재 절판입니다. 그간 읽어주신 분들께 감사드립니다. 자바스크립트로 손쉽게 웹 크롤러를 만들고, 수집한 데이터를 저장/처리하여 세련되게 시각화하고, 쉽고 간단한 스트립트로 원하는 데이터를 모두 내려받자! 출판사 제이펍원출판사 ソシム원서명 JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック (ISBN: 9784883379934)저자명 쿠지라 히코우즈쿠에역자명 이동규출판일 2016년 12월 30일페이지 516쪽시리즈 (없음)판 형 (188*245*25)제 본 무선(soft cover)정 가 30,000원ISBN 979-11-85890-66-1 (93000)키워드 머신러닝 / 문자 인식 / 형태소 분석 / 베이지안 필터 / GoogleCharts / D3.js / SNS / 웹 AP.. 더보기
알고리즘 중심의 머신러닝 가이드(제2판) 그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다.머신러닝에 필요한 수학/통계학 배경 지식!머신러닝에 사용되는 주요 알고리즘의 원리!의사코드가 아닌 파이썬 코드 중심의 예제! 출판사 제이펍원출판사 Chapman and Hall원서명 Machine Learning: An Algorithmic Perspective, Second Edition(ISBN: 9781466583283)지은이 스티븐 마슬랜드옮긴이 강전형출판일 2016년 12월 28일페이지 532쪽시리즈 I♥A.I. 02판 형 46배판 변형(188*245*25)제 본 무선(soft cover)정 가 32,000원ISBN 979-11-85890-72-2 (93000)키워드 machine learning / 머신 러닝 / deep lea.. 더보기
딥 러닝 제대로 시작하기 그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다.데이터 과학과 머신 러닝 전문가를 위한 콤팩트한 입문서!기초부터 고급 이론까지 체계적으로 정리하여 알기 쉬운 딥 러닝 교과서! 출판사 제이펍원출판사 고단샤(講談社)원서명 深層学習(ISBN: 9784061529021)지은이 오카타니 타카유키옮긴이 심효섭출판일 2016년 10월 10일페이지 220쪽시리즈 I♥A.I. 01판 형 크라운판 변형(170*225*13)제 본 무선(soft cover)정 가 20,000원ISBN 979-11-85890-59-3 (93000)키워드 deep learning / 인공지능 / 머신 러닝 / machine learning / 데이터 과학 / 데이터 분석분 야 컴퓨터 공학 > 인공지능 관련 사이트■ 아마존 재팬.. 더보기