본문 바로가기

빅데이터

빅데이터 입문자를 위한 속이 꽉 찬 서적! 안녕하세요? 오늘 소개할 책은 빅데이터 서적입니다. 《카프카 핵심 가이드》, 《몽고디비 인 액션(제판)》, 《하이 퍼포먼스 스파크》, 《러닝 스파크》와 같이 빅데이터와 연관된 도구나 언어 관련 서적은 간간이 출판해 왔지만, 빅데이터만을 중점적으로 다루는 기술 서적은 처음 출간하는 것 같습니다. 대부분의 사람이 빅데이터라고 하면 '데이터 분석'을 먼저 떠올릴 텐데, 이 책은 데이터 분석 기법은 거의 다루지 않습니다. 이 책의 주제는 처음부터 끝까지 '데이터 처리를 어떻게 시스템화할 것인가', 즉 '데이터 처리의 자동화'에 포커스를 맞추고 있습니다. 데이터 분석가의 업무 중 가장 많은 시간을 차지하면서도 가장 하기 싫은 영역이 바로 데이터 수집과 전처리 과정일 텐데요. (참고: http://www.dodom.. 더보기
카프카를 만든 컨플루언트와 링크드인의 엔지니어들이 직접 저술한 카프카 서적! 네. 제목처럼 오늘 안내할 책은 최근 각광받고 있는 실시간 비동기 스트리밍 솔루션인 카프카(Kafka) 서적입니다. 카프카를 만든 컨플루언트와 링크드인의 핵심 엔지니어 세 명이 직접 저술하였으며, 아파치 카프카를 실제 업무에 사용하는 데 필요한 내부 메커니즘에서부터 API에 이르기까지 모든 핵심 사항을 알려줍니다. 저작권사는 오라일리 출판사이고요. 현재 국내에 카프카와 관련 서적은 3종이 출간된 것으로 알고 있는데, 그중에서 고승범 님의 《카프카, 데이터 플랫폼의 최강자》가 가장 널리 읽히는 것 같습니다. 이번에 펴내는 저희 책과 함께 읽으신다면 시너지 효과가 있지 않을 까 싶습니다. 이 책에 담긴 주요 내용은 다음과 같습니다. 데이터 파이프라인 시스템 및 카프카의 핵심 개념을 이해하고, 카프카를 설치하.. 더보기
빅데이터 분석의 대세 프레임워크, 아파치 스파크 빠르게 사용할 수 있는 데이터 분석 라이브러리, 스칼라나 자바, 파이썬, R 등의 다양한 언어를 지원하며, 이들 언어와 데이터베이스에 대한 기본적인 이해가 있으면 쉽게 사용할 수 있다는 장점 등으로 최근 들어 많은 곳에서 아파치 스파크(Apache Spark)를 이용하고 있는 것 같습니다. 애플이나 페이스북과 같은 거대 IT 기업은 물론, 관공서나 유수의 금융/통신 업체들에서도 이용하고 있다고 합니다. 오픈소스이기 때문에 사용하려는 회사에 맞게 자유롭게 아파치 기반의 분석 인프라룰 구현할 수 있다는 것도 큰 장점인 것 같습니다. 그래서 저희 제이펍도 스파크의 가능성을 보고 스파크의 창시자인 마테이 자하리아와 출륭한 스파크 커미터인 홀든 카로 등이 집필한 《러닝 스파크》를 15년 가을에 출간하였었는데요. .. 더보기
몽고디비 인 액션(제2판) MongoDB나 NoSQL에 경험 없는 개발자를 위한 쉽고 실전적인 입문서!빅 데이터 시대 최고의 NoSQL 데이터베이스! 도서구매 사이트(가나다순)[강컴] [교보문고] [도서11번가] [반디앤루니스] [알라딘] [예스이십사] [인터파크] 전자책 구매 사이트(가나다순)[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사] [인터파크] 출판사 제이펍원출판사 Manning Publications원서명 MongoDB in Action(2nd Edition)(원서 ISBN: 9781617291609)저자명 카일 뱅커, 피터 배컴, 숀 버크, 덕 개릿, 팀 호킨스역자명 김인범출판일 2018년 5월 17일페이지 584쪽시리즈 I♥Cloud 15(아이러브 클라우드 15)판 형 (188*245*26)제 본 무선.. 더보기
빅 데이터 시대, 최고의 NoSQL 데이터베이스! 오라클, 마이크로소프트 SQL, MySQL 등으로 대변되는 기존의 관계형 데이터베이스 관리 시스템(RDBMS)이 빅 데이터를 처리하는 데 비효율적인 측면이 있어 그 대안으로 NoSQL(Not only SQL)이 선택되고 있다는 건 주지의 사실일 겁니다. 정말 많은 NoSQL 데이터베이스 시스템들이 있는데, MongoDB, Cassandra, Hbase가 아마 대표적인 NoSQL이 아닌가 싶습니다. 오늘 소개할 책은 그중에서도 구글, 페이스북, 포스퀘어, 이베이 등 상업적인 사이트의 백엔드 시스템에서 채택되어 활발히 이용되고 있고 9년이란 시간 꾸준히 업데이트되며 안정성을 보여 온 MongoDB에 관한 책입니다. 2012년에 국내 최초의 MongoDB 서적으로 출간된 《몽고디비 인 액션》이 근 6년 만에 .. 더보기
따라하며 배우는 데이터 과학: 실리콘밸리 데이터 과학자가 알려주는 2018년 세종도서 학술부문 우수도서 선정!가장 빠르게, 가장 제대로 배우는 데이터 과학 입문서! 도서구매 사이트(가나다순)[강컴] [교보문고] [도서11번가] [반디앤루니스] [알라딘] [예스이십사] [인터파크] 전자책 구매 사이트(가나다순)[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사] [인터파크] 출판사 제이펍지은이 권재명출판일 2017년 8월 4일페이지 364쪽판 형 46배판변형(188*245*17)제 본 무선(soft cover)정 가 26,000원ISBN 979-11-85890-86-9 (93000)키워드 R 언어 / SQL / 데이터 / 데이터 시각화 / ggplot2 / 통계 / 빅데이터 / 회귀분석 분 야 빅데이터 / 통계 관련 사이트■ 저자 운영 A/S 블로그 관련 포스트.. 더보기
실리콘밸리 데이터 과학자가 전하는 "데이터 과학 입문" 이 책을 기획한 지 2년이란 시간이 훌쩍 지났네요. 매번 드리는 말씀이지만, 저서 만들기가 정말 만만치 않네요. 출판사는 출판사대로, 저자는 저자대로 긴 시간 사투를 벌여야 합니다. 기술 서적에서는 상대적으로 덜 하지만, 글 한 줄이 막혀 몇 날 며칠 밤을 끙끙대기도 한다니... 어쨌든 그 긴 터널과 같은 과정을 거쳐 곧 여러분을 찾아뵙게 되는 황홀한 순간을 맞이하게 되었습니다. "데이터를 지배하는 자가 앞으로 IT 패권을 가져갈 가능성이 높다."_마윈(알리바마 회장) 마윈이 데이터 분석의 중요성을 역설하며 했던 말이죠. 엄청나게 쏟아지고 있는 데이터 홍수 속에서 비즈니스적 가치가 있는 데이터를 찾아내고, 분석하고, 가공하여 유의미한 결론을 도출하는 과정이 정말 중요해질 것으로 판단됩니다. AI와 더불어.. 더보기
알고리즘 중심의 머신러닝 가이드(제2판) 그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다.머신러닝에 필요한 수학/통계학 배경 지식!머신러닝에 사용되는 주요 알고리즘의 원리!의사코드가 아닌 파이썬 코드 중심의 예제! 출판사 제이펍원출판사 Chapman and Hall원서명 Machine Learning: An Algorithmic Perspective, Second Edition(ISBN: 9781466583283)지은이 스티븐 마슬랜드옮긴이 강전형출판일 2016년 12월 28일페이지 532쪽시리즈 I♥A.I. 02판 형 46배판 변형(188*245*25)제 본 무선(soft cover)정 가 32,000원ISBN 979-11-85890-72-2 (93000)키워드 machine learning / 머신 러닝 / deep lea.. 더보기