창시자와 커미터가 직접 저술한 스파크 입문서!


출판사 제이펍

원출판사 O’Reilly Media

원서명 Learning Spark: Lightning-Fast Big Data Analysis(원서 ISBN: 9781449358624)

저자명 홀든 카로, 앤디 콘빈스키, 패트릭 웬델, 마테이 자하리아

역자명 박종영

출판일 2015년 10월 15일

페이지 336쪽

시리즈 I♥Cloud 10 (아이러브클라우드 10)

판  형 (188*245*22)

제  본 무선(soft cover)

정  가 24,000원

ISBN 979-11-85890-33-3 (93000)

키워드 클라우드 / 아파치 / 하둡 / 스파크 / 데이터 분석 / 클라스터 / SQL

분야 데이터베이스 / 빅데이터


관련 사이트

아마존 도서소개 페이지

원출판사 도서소개 페이지


관련 포스트

■ 2015/10/05 - [출간전 책소식] - 스파크 창시자와 커미터들이 직접 저술한 스파크 입문서!


관련 시리즈

I♥Cloud(아이러브클라우드)


관련 도서

빅 데이터 시대의 하둡 완벽 입문(제2판)

스칼라로 배우는 함수형 프로그래밍 

데이터 과학자, 무엇을 배울 것인가 

빅 데이터, 어떻게 활용할 것인가 


관련 파일 다운로드

예제 코드


교재 검토용 증정 안내

■ 학교 및 학원에서 교재 선정을 위해 책을 파일로 검토해보고자 하시는 분들은 다음의 페이지에서 신청 양식을 작성해주시기 바랍니다. 확인 후 연락을 드리도록 하겠습니다. http://goo.gl/vBtPo3


강의보조 자료

교재로 채택하신 분들은 메일을 보내주시면 아래의 자료를 보내드리겠습니다: jeipubmarketer@gmail.com

■ 본문의 그림과 표


샘플 PDF(차례, 옮긴이 머리말,이 책에 대하여, 저자 소개, 베타리더 후기, 1장 스파크를 이용한 데이터 분석 소개, 2장 스파크 맛보기)

러닝스파크_sample.pdf


정오표 페이지

■ (등록되는 대로 링크를 걸어드리겠습니다.)

 

도서구매 사이트(가나다순)


도서 소개
창시자와 커미터가 직접 저술한 스파크 입문서 !

모든 분야에서 데이터는 점점 많아지고 있다. 어떻게 그 엄청난 데이터를 효과적으로 다룰 것인가? 이 책은 데이터 분석 작업을 빠르게 작성하고 실행하게 해 주는 오픈 소스 클러스터 컴퓨팅 시스템인 스파크를 소개한다. 스파크에서 파이썬, 자바, 스칼라로 제공되는 간단한 API들을 써서 방대한 데이터세트를 가볍게 처리할 수 있다.

스파크를 만든 사람들이 쓴 이 책은 데이터 과학자들이나 엔지니어들이 곧바로 스파크를 쓸 수 있게 해 줄 것이다. 이 책을 통해 병렬 작업들을 코드 몇 라인으로만 실행하는 방법과 단순한 배치 프로그램부터 스트림 처리나 머신 러닝까지 다루는 프로그램의 제작 방법을 배울 수 있다.

■ 분산 데이터세트, 메모리 기반 캐싱, 대화형 셸 같은 스파크의 특징들을 빠르게 파고든다
■ 스파크 SQL, 스파크 스트리밍, MLlib 같은 스파크의 강력한 내장 라이브러리를 효과적으로 쓸 수 있다
■ 하이브, 하둡, 머하웃, 스톰 등 여러 도구를 혼용하고 연동하는 대신, 일관된 프로그래밍 개념을 사용한다
■ 대화형, 배치, 스트리밍 애플리케이션들을 서버에 올리는 방법을 배운다
■ HDFS, 하이브, JSON, S3 같은 데이터 소스에 연결할 수 있다
■ 데이터 파티셔닝이나 공유 변수 같은 고급 개념들을 익힌다

추천사
《러닝 스파크》는 빅데이터 애플리케이션을 구축해 주는 가장 인기 있는 프레임워크 입문서를 찾는 사람들에게 내가 가장 추천하는 책이다.
_벤 로리카(Ben Lorica), 오라일리 미디어 수석 데이터 과학자

지은이 소개
홀든 카로(Holden Karau)
데이터브릭스(Databricks)의 소프트웨어 개발 엔지니어이며, 오픈 소스에서 활발하게 활동 중이다. 그녀는 초기 스파크 책의 저자이기도 하다. 데이터브릭스 이전에는 구글(Google), 포스퀘어(Foursqare), 아마존(Amazon) 같은 회사들에서 다양한 검색 및 분류에 관련된 일을 하였다. 그녀는 워털루 대학(University of Waterloo)을 졸업하면서 컴퓨터 과학/수학 학사학위를 취득했다. 소프트웨어 외에는 사격, 용접, 훌라후프를 즐긴다.

앤디 콘빈스키(Andy Konwinski)
데이터브릭스의 공동 창업자이다. 박사과정으로 재학하다가 UC 버클리(Berkeley)의 AMPLab에서 박사 후 과정을 수행하며 대용량 분산 컴퓨팅과 클러스터 스케줄링에 대해 연구했다. 그는 아파치 메소스(Apache Mesos) 프로젝트의 공동 창시자이며 커미터이다. 또한, 구글에서 차세대 클러스터 스케줄링 시스템인 오메가(Omega)를 설계하며 시스템 엔지니어들 및 연구원들과 일하였다. 최근에는 AMP 캠프 빅데이터 부트캠프와 스파크 서밋을 주최하고 이끌고 있으며, 스파크 프로젝트에도 공헌하고 있다.

패트릭 웬델(Patrick Wendell)
데이터브릭스의 공동 창업자이며 스파크 커미터이자 PMC 멤버이다. 스파크 프로젝트에서 스파크 1.0을 포함해 여러 버전의 릴리스 관리자로 활동해 왔다. 패트릭은 또 스파크 코어 엔진의 여러 하부 시스템을 유지 관리하고 있다. 데이터브릭스 창업 이전에 UC 버클리에서 컴퓨터 과학 석사학위를 취득하였다. 그의 연구 분야는 대용량 분석의 워크로드에 대해 빠른 응답성을 보이는 스케줄링에 대한 것이었다. 프린스턴 대학(Princeton University)에서 컴퓨터 과학 교육 학사학위를 받기도 했다.

마테이 자하리아(Matei Zaharia)
아파치 스파크의 창시자이자 데이터브릭스의 최고기술경영자(CTO)이다. UC 버클리에서 박사학위를 받았으며, 이때 연구 프로젝트로 스파크를 시작했다. 현재는 아파치의 부사장이기도 하다. 스파크 외에도 클러스터 컴퓨팅 분야에서의 연구와 다른 프로젝트들에서 오픈 소스 공헌을 하였는데, 그중에는 아파치 하둡(커미터로 활동)이나 아파치 메소스(프로젝트 시작에 관여) 등이 있다.

옮긴이 소개
박종영
한국 오라클, 세븐 네트웍스 코리아 등의 회사에서 DBMS 엔진 및 푸시 메시징 엔진 등의 개발 경험을 갖고 있으며, 현재는 빅데이터 전문회사인 그루터(http://www.gruter.com/)에서 아파치 타조(http://tajo.apache.org/) 개발에 매진하고 있다.

차례
Chapter 1 스파크를 이용한 데이터 분석 소개 _ 1
아파치 스파크란 무엇인가? _ 1
통합된 구성 _ 2
스파크는 누가, 무엇을 위해 사용할까? _ 5
스파크의 간략한 역사 _ 8
스파크의 버전과 릴리스 _ 9
스파크의 저장소 계층 _ 9

더보기


저작자 표시 비영리 동일 조건 변경 허락
신고
크리에이티브 커먼즈 라이선스
Creative Commons License

댓글을 달아 주세요

  1.  댓글주소  수정/삭제  댓글쓰기 utxtion@me.com 2015.12.28 00:17 신고

    혹시 e북형태로 판매하는 사이트는 없나요

    •  댓글주소  수정/삭제 Favicon of http://lemonflavor.tistory.com BlogIcon 레몬에이드 2015.12.28 10:38 신고

      안녕하세요.
      현재는 전자책으로 제공하고 있지는 않고요. 내년에는 하나둘씩 출간될 예정입니다. 조금만 더 기다려주시면 감사하겠습니다. 행복한 하루 보내세요! 감사합니다 :)



티스토리 툴바