본문 바로가기

빅데이터

원하는 데이터를 자바스크립트로 수집하고 분석하는 기막힌 방법! 웹에는 수많은 자료가 흩어져 있습니다. 사이트에 들어가 일일이 모은다는 건 거의 불가능에 가깝기도 하고, 정확하지도 않겠죠. 우리가 원하는 데이터만을 찾을 수 있다면, 그리고 그 데이터들을 우리 대신에 누군가가 정리하고 분석할 수 있다면 정말 편하지 않을까요? 오늘 소개해드릴 책이 바로 그런 책입니다. 자바스크립트와 Node.js를 이용하여 다양한 에이전트를 만들고 그 에이전트로 하여금 웹에 흩어져 있는 자료들을 찾고, 정리하고, 분석하는 방법을 안내합니다. 얼마 전에는 파이썬으로 웹 크롤러를 만드는 책도 나왔었죠? 파이썬을 이용하고자 하는 분이라면 그 책을, 자바스크립트를 이용하시겠다면 저희 책을 이용해주시면 좋을 것 같습니다. 옮긴이 머리말에도 밝히고 있듯이, 이 책은 이동규 역자님이 일본 여행 중 .. 더보기
포스트 모바일을 이끌 사물인터넷! 매년 말에 차기 년도 ‘10대 전략 기술’을 발표하여 IT와 비즈니스 업계를 술렁이게 하는 업체가 있죠. 시장조사 및 컨설팅 서비스를 전문으로 하는 가트너(Gartner)라는 업체인데요. 이 업체에서 2012년~2016년에 발표한 10대 기술을 먼저 살펴보겠습니다. 모바일부터 3D프린팅, 인공지능 등 최근 관심이 높은 기술 대부분이 포함되어 있네요. 그중에서 좀 진하게 표시한 것들이 사물인터넷과 관련 있는 기술들입니다. 2012년부터 언급되기 시작하여 2016년에는 다양한 분야와 결합하는 모습을 보이고 있습니다. 이런 추이를 본다면, 향후 우리가 사용하는 상당수의 사물로부터 정보를 얻고, 그 정보를 통해 새로운 부가가치가 만들어지지 않을까 예상해 봅니다. 사물인터넷이란 용어가 몇 년 전만 하더라도 굉장히.. 더보기
러닝 스파크: 번개같이 빠른 데이터 분석 개정판이 출간되었습니다. https://jpub.tistory.com/1291그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다.창시자와 커미터가 직접 저술한 스파크 입문서! 출판사 제이펍원출판사 O’Reilly Media원서명 Learning Spark: Lightning-Fast Big Data Analysis(원서 ISBN: 9781449358624)저자명 홀든 카로, 앤디 콘빈스키, 패트릭 웬델, 마테이 자하리아역자명 박종영출판일 2015년 10월 15일페이지 336쪽시리즈 I♥Cloud 10 (아이러브클라우드 10)판 형 (188*245*22)제 본 무선(soft cover)정 가 24,000원ISBN 979-11-85890-33-3 (93000)키워드 클라우드 / 아파치 / 하둡.. 더보기
스파크 창시자와 커미터들이 직접 저술한 스파크 입문서! 오늘 소개해드릴 책은 최근 빅데이터 처리 엔진으로 인기가 급부상하고 있는 스파크에 관한 입문서입니다. 오라일리에서 올 2월말에 출간된 서적이며, 스파크의 창시자인 마테이 자하리아(Matei Zaharia)를 비롯해 스파크 커미터들이 직접 집필에 참여하여 출간 전부터 많은 관심을 받았던 책입니다. 번역은 타조(Tajo)로 유명한 그루터의 박종영 님께서 맡아주셨고요. 스파크에 대해 속속들이 알고 있는 저자들이 집필한 서적이라 스파크 설치, 운영, 그리고 활용하는 방법까지를 잘 다루고 있으며, 스파크 입문자들을 위해 설명도 쉽게 하고 있는 것이 특징입니다. ■ 분산 데이터세트, 메모리 기반 캐싱, 대화형 셸 같은 스파크의 특징들을 빠르게 파고든다■ 스파크 SQL, 스파크 스트리밍, MLlib 같은 스파크의 강.. 더보기
데이터 과학자, 무엇을 배울 것인가: 빅 데이터 시대의 데이터 과학자 양성 독본 그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다. [2015년 세종도서 우수학술도서 선정!] 데이터 과학자를 꿈꾸는 사람들을 위한 최적의 입문서! 21세기의 가장 섹시한 직업, 데이터 과학자 양성을 위한 필수 기초지식 수록! 출판사 제이펍 원출판사 技術評論社(기술평론사) 원서명 データサイエンティスト養成読本(원서 ISBN: 9784774158969) 저자명 사토 히로유키 외 11인 역자명 정인식 출판일 2014년 6월 30일 페이지 316쪽 시리즈 (없음) 판 형 46배판 변형(188*245*19) 제 본 무선(soft cover) 정 가 24,000원 ISBN 978-89-94506-97-5 (93000) 키워드 빅 데이터, 데이터 사이언티스트, 데이터베이스, R 언어, RStudio,.. 더보기
빅 데이터 시대의 하둡 완벽 입문(제2판) 이 책은 현재 절판입니다. 그간 읽어주셔서 감사드립니다. ​ Hadoop의 다양한 애플리케이션 개발 환경을 상세히 설명하고 구축과 운영에 관한 자세한 정보 수록! A부터 Z까지 Hadoop에 관한 거의 모든 것! 출판사 제이펍 원출판사 쇼에이사 원서명 Hadoop徹底入門 第2版 (원서 ISBN: 9784798129648) 저자명 오오타 카스기, 이와사키 마사타케, 사루타 코우스케, 시모가키 토오루, 후지이 타츠로우, 야마시타 신이치 지음 역자명 김완섭 출판일 2014년 6월 18일 페이지 656쪽 시리즈 I♥Cloud 09 (아이러브클라우드 09) 판 형 4x6배판 변형(188*245*31) 제 본 무선(soft cover) 정 가 36,000원 ISBN 978-89-94506-96-8 (93000) 키.. 더보기
데이터 과학자 양성을 위한 가이드가 출간됩니다. 하버드 비즈니스 리뷰(HBR)는 2012년 10월, 데이터 과학자(Data Scientist)를 21세기 가장 섹시한 직업으로 선정하며, "수요가 공급보다 압도적으로 많은 직업이 될 것"이라고 발표하였었죠. 그 이후로 미국은 물론 우리나라에서도 빅 데이터 전문가인 데이터 과학자에 대한 관심이 점점 더 고조되고 있는 것 같습니다. 이에 발맞춰서 데이터 과학자 혹은 빅 데이터 실무에 관한 책들이 쏟아져 나오기 시작하였고, 관련 강좌들도 앞다투어 개설되고 있습니다. 그런데 어떤 책으로 시작하는 게 좋을지, 어떤 강좌가 내게 맞을지 선택하기가 쉽지 않았으리라 생각합니다. 왜냐하면 배워야 할 게 한둘이 아니기 때문이죠. 위의 이미지에서도 볼 수 있듯이, 데이터 과학자의 필수 기술로 언급되고 있는 것들은 정말 다양.. 더보기
빅 데이터 시대의 하둡 완벽 입문(제2판) 빅 데이터를 기술적으로 설명할 때 하둡을 빠뜨릴 수는 없겠죠. 하둡에 대한 자세한 설명은 아래의 링크를 참조하시고요. ▶ 위키백과 이번에 저희 제이펍에서 펴내는 하둡 책을 한마디로 말한다면, 살짝 오버해서 '하둡에 관한 거의 모든 것'이라 정의할 수 있겠습니다. 또 '하둡에 관한 가장 친절한 책'이라 자부할 수 있을 만큼, 정말 옆에서 멘토가 알려주듯 차근차근 일러주는 형식을 취하고 있습니다. 이번 책도 독자 여러분이 읽기 전에 '제이펍의 베타리더' 여섯 분을 통해 사전 검증을 시행했는데요, 그중 책에도 실린 두 분의 솔직한 베타리딩 후기를 올려드립니다. 김*범(SK C&C)Hadoop에 대해 이보다 더 자세한 가이드는 없을 것입니다. 필요한 정보가 충분히 수록되어 있고, 환경 설정 구성 및 운영 시 발.. 더보기