본문 바로가기

빅데이터

빅데이터 분석의 대세 프레임워크, 아파치 스파크 빠르게 사용할 수 있는 데이터 분석 라이브러리, 스칼라나 자바, 파이썬, R 등의 다양한 언어를 지원하며, 이들 언어와 데이터베이스에 대한 기본적인 이해가 있으면 쉽게 사용할 수 있다는 장점 등으로 최근 들어 많은 곳에서 아파치 스파크(Apache Spark)를 이용하고 있는 것 같습니다. 애플이나 페이스북과 같은 거대 IT 기업은 물론, 관공서나 유수의 금융/통신 업체들에서도 이용하고 있다고 합니다. 오픈소스이기 때문에 사용하려는 회사에 맞게 자유롭게 아파치 기반의 분석 인프라룰 구현할 수 있다는 것도 큰 장점인 것 같습니다. 그래서 저희 제이펍도 스파크의 가능성을 보고 스파크의 창시자인 마테이 자하리아와 출륭한 스파크 커미터인 홀든 카로 등이 집필한 《러닝 스파크》를 15년 가을에 출간하였었는데요. .. 더보기
몽고디비 인 액션(제2판) MongoDB나 NoSQL에 경험 없는 개발자를 위한 쉽고 실전적인 입문서!빅 데이터 시대 최고의 NoSQL 데이터베이스! 도서구매 사이트(가나다순)[강컴] [교보문고] [도서11번가] [반디앤루니스] [알라딘] [예스이십사] [인터파크] 전자책 구매 사이트(가나다순)[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사] [인터파크] 출판사 제이펍원출판사 Manning Publications원서명 MongoDB in Action(2nd Edition)(원서 ISBN: 9781617291609)저자명 카일 뱅커, 피터 배컴, 숀 버크, 덕 개릿, 팀 호킨스역자명 김인범출판일 2018년 5월 17일페이지 584쪽시리즈 I♥Cloud 15(아이러브 클라우드 15)판 형 (188*245*26)제 본 무선.. 더보기
빅 데이터 시대, 최고의 NoSQL 데이터베이스! 오라클, 마이크로소프트 SQL, MySQL 등으로 대변되는 기존의 관계형 데이터베이스 관리 시스템(RDBMS)이 빅 데이터를 처리하는 데 비효율적인 측면이 있어 그 대안으로 NoSQL(Not only SQL)이 선택되고 있다는 건 주지의 사실일 겁니다. 정말 많은 NoSQL 데이터베이스 시스템들이 있는데, MongoDB, Cassandra, Hbase가 아마 대표적인 NoSQL이 아닌가 싶습니다. 오늘 소개할 책은 그중에서도 구글, 페이스북, 포스퀘어, 이베이 등 상업적인 사이트의 백엔드 시스템에서 채택되어 활발히 이용되고 있고 9년이란 시간 꾸준히 업데이트되며 안정성을 보여 온 MongoDB에 관한 책입니다. 2012년에 국내 최초의 MongoDB 서적으로 출간된 《몽고디비 인 액션》이 근 6년 만에 .. 더보기
따라하며 배우는 데이터 과학: 실리콘밸리 데이터 과학자가 알려주는 2018년 세종도서 학술부문 우수도서 선정!가장 빠르게, 가장 제대로 배우는 데이터 과학 입문서! 출판사 제이펍지은이 권재명출판일 2017년 8월 4일페이지 364쪽판 형 46배판변형(188*245*17)제 본 무선(soft cover)정 가 26,000원ISBN 979-11-85890-86-9 (93000)키워드 R 언어 / SQL / 데이터 / 데이터 시각화 / ggplot2 / 통계 / 빅데이터 / 회귀분석 분 야 빅데이터 / 통계 관련 사이트■ 저자 운영 A/S 블로그 관련 포스트■ 2017/07/27 - [출간전 책소식] - 실리콘밸리 데이터 과학자가 전하는 "데이터 과학 입문" 관련 시리즈■ (없음) 관련 도서■ 데이터 과학자, 무엇을 배울 것인가: 빅 데이터 시대의 데이터 과학자 양성 독본 .. 더보기
실리콘밸리 데이터 과학자가 전하는 "데이터 과학 입문" 이 책을 기획한 지 2년이란 시간이 훌쩍 지났네요. 매번 드리는 말씀이지만, 저서 만들기가 정말 만만치 않네요. 출판사는 출판사대로, 저자는 저자대로 긴 시간 사투를 벌여야 합니다. 기술 서적에서는 상대적으로 덜 하지만, 글 한 줄이 막혀 몇 날 며칠 밤을 끙끙대기도 한다니... 어쨌든 그 긴 터널과 같은 과정을 거쳐 곧 여러분을 찾아뵙게 되는 황홀한 순간을 맞이하게 되었습니다. "데이터를 지배하는 자가 앞으로 IT 패권을 가져갈 가능성이 높다."_마윈(알리바마 회장) 마윈이 데이터 분석의 중요성을 역설하며 했던 말이죠. 엄청나게 쏟아지고 있는 데이터 홍수 속에서 비즈니스적 가치가 있는 데이터를 찾아내고, 분석하고, 가공하여 유의미한 결론을 도출하는 과정이 정말 중요해질 것으로 판단됩니다. AI와 더불어.. 더보기
알고리즘 중심의 머신러닝 가이드(제2판) 머신러닝에 필요한 수학/통계학 배경 지식!머신러닝에 사용되는 주요 알고리즘의 원리!의사코드가 아닌 파이썬 코드 중심의 예제! 출판사 제이펍원출판사 Chapman and Hall원서명 Machine Learning: An Algorithmic Perspective, Second Edition(ISBN: 9781466583283)지은이 스티븐 마슬랜드옮긴이 강전형출판일 2016년 12월 28일페이지 532쪽시리즈 I♥A.I. 02판 형 46배판 변형(188*245*25)제 본 무선(soft cover)정 가 32,000원ISBN 979-11-85890-72-2 (93000)키워드 machine learning / 머신 러닝 / deep learning / 인공지능 / 데이터 과학 / 데이터 분석 / 알고리즘.. 더보기
원하는 데이터를 자바스크립트로 수집하고 분석하는 기막힌 방법! 웹에는 수많은 자료가 흩어져 있습니다. 사이트에 들어가 일일이 모은다는 건 거의 불가능에 가깝기도 하고, 정확하지도 않겠죠. 우리가 원하는 데이터만을 찾을 수 있다면, 그리고 그 데이터들을 우리 대신에 누군가가 정리하고 분석할 수 있다면 정말 편하지 않을까요? 오늘 소개해드릴 책이 바로 그런 책입니다. 자바스크립트와 Node.js를 이용하여 다양한 에이전트를 만들고 그 에이전트로 하여금 웹에 흩어져 있는 자료들을 찾고, 정리하고, 분석하는 방법을 안내합니다. 얼마 전에는 파이썬으로 웹 크롤러를 만드는 책도 나왔었죠? 파이썬을 이용하고자 하는 분이라면 그 책을, 자바스크립트를 이용하시겠다면 저희 책을 이용해주시면 좋을 것 같습니다. 옮긴이 머리말에도 밝히고 있듯이, 이 책은 이동규 역자님이 일본 여행 중 .. 더보기
포스트 모바일을 이끌 사물인터넷! 매년 말에 차기 년도 ‘10대 전략 기술’을 발표하여 IT와 비즈니스 업계를 술렁이게 하는 업체가 있죠. 시장조사 및 컨설팅 서비스를 전문으로 하는 가트너(Gartner)라는 업체인데요. 이 업체에서 2012년~2016년에 발표한 10대 기술을 먼저 살펴보겠습니다. 모바일부터 3D프린팅, 인공지능 등 최근 관심이 높은 기술 대부분이 포함되어 있네요. 그중에서 좀 진하게 표시한 것들이 사물인터넷과 관련 있는 기술들입니다. 2012년부터 언급되기 시작하여 2016년에는 다양한 분야와 결합하는 모습을 보이고 있습니다. 이런 추이를 본다면, 향후 우리가 사용하는 상당수의 사물로부터 정보를 얻고, 그 정보를 통해 새로운 부가가치가 만들어지지 않을까 예상해 봅니다. 사물인터넷이란 용어가 몇 년 전만 하더라도 굉장히.. 더보기