본문 바로가기

맵리듀스

빅데이터 분석의 대세 프레임워크, 아파치 스파크 빠르게 사용할 수 있는 데이터 분석 라이브러리, 스칼라나 자바, 파이썬, R 등의 다양한 언어를 지원하며, 이들 언어와 데이터베이스에 대한 기본적인 이해가 있으면 쉽게 사용할 수 있다는 장점 등으로 최근 들어 많은 곳에서 아파치 스파크(Apache Spark)를 이용하고 있는 것 같습니다. 애플이나 페이스북과 같은 거대 IT 기업은 물론, 관공서나 유수의 금융/통신 업체들에서도 이용하고 있다고 합니다. 오픈소스이기 때문에 사용하려는 회사에 맞게 자유롭게 아파치 기반의 분석 인프라룰 구현할 수 있다는 것도 큰 장점인 것 같습니다. 그래서 저희 제이펍도 스파크의 가능성을 보고 스파크의 창시자인 마테이 자하리아와 출륭한 스파크 커미터인 홀든 카로 등이 집필한 《러닝 스파크》를 15년 가을에 출간하였었는데요. .. 더보기
스파크 창시자와 커미터들이 직접 저술한 스파크 입문서! 오늘 소개해드릴 책은 최근 빅데이터 처리 엔진으로 인기가 급부상하고 있는 스파크에 관한 입문서입니다. 오라일리에서 올 2월말에 출간된 서적이며, 스파크의 창시자인 마테이 자하리아(Matei Zaharia)를 비롯해 스파크 커미터들이 직접 집필에 참여하여 출간 전부터 많은 관심을 받았던 책입니다. 번역은 타조(Tajo)로 유명한 그루터의 박종영 님께서 맡아주셨고요. 스파크에 대해 속속들이 알고 있는 저자들이 집필한 서적이라 스파크 설치, 운영, 그리고 활용하는 방법까지를 잘 다루고 있으며, 스파크 입문자들을 위해 설명도 쉽게 하고 있는 것이 특징입니다. ■ 분산 데이터세트, 메모리 기반 캐싱, 대화형 셸 같은 스파크의 특징들을 빠르게 파고든다■ 스파크 SQL, 스파크 스트리밍, MLlib 같은 스파크의 강.. 더보기