데이터 전처리 썸네일형 리스트형 빅데이터 입문자를 위한 속이 꽉 찬 서적! 안녕하세요? 오늘 소개할 책은 빅데이터 서적입니다. 《카프카 핵심 가이드》, 《몽고디비 인 액션(제판)》, 《하이 퍼포먼스 스파크》, 《러닝 스파크》와 같이 빅데이터와 연관된 도구나 언어 관련 서적은 간간이 출판해 왔지만, 빅데이터만을 중점적으로 다루는 기술 서적은 처음 출간하는 것 같습니다. 대부분의 사람이 빅데이터라고 하면 '데이터 분석'을 먼저 떠올릴 텐데, 이 책은 데이터 분석 기법은 거의 다루지 않습니다. 이 책의 주제는 처음부터 끝까지 '데이터 처리를 어떻게 시스템화할 것인가', 즉 '데이터 처리의 자동화'에 포커스를 맞추고 있습니다. 데이터 분석가의 업무 중 가장 많은 시간을 차지하면서도 가장 하기 싫은 영역이 바로 데이터 수집과 전처리 과정일 텐데요. (참고: http://www.dodom.. 더보기 이전 1 다음