뉴스나 연설 그리고 소셜 미디어에서 이뤄지는 사적인 대화에 이르기까지 자연어는 가장 널리 쓰이면서도 활용률은 낮은 데이터 중 하나입니다. 자연어가 일정하게 흐르지 않고 상황에 맞춰 늘 변하며 적응하기 때문인데요. 게다가 자연어는 정해진 '규칙(rule)'에 따라 정의되는 것이 아니라 '용례(use)'에 따라 정의되므로 텍스트 분석 응용 프로그램을 창의적으로 만들어 사용해야 자연어가 담고 있는 진짜 의미를 해독할 수 있습니다.
그래서!
어떻게 하면 텍스트 분석과 자연어 처리를
잘할 수 있을까요?
그 방법을 저명한 세 명의 데이터 과학자가 안내합니다.
《파이썬으로 배우는 응용 텍스트 분석》
파이썬 라이브러리로 학습하는 자연어 처리와 머신러닝 응용 테크닉!
이 책은 풍부한 과학 계산과 수치 계산이 가능한 사이킷런, NLTK, Gensim, spaCy, NetworkX, Yellowbrick 등의 파이썬 라이브러리를 사용해 텍스트 분석을 할 수 있도록 머신러닝을 응용하는 데 초점을 맞춥니다.
또한, 이 책은 다음과 같은 내용에 집중합니다.
■ 자연어 처리의 기본 개념은 물론, 머신러닝을 이용한 최첨단 NLP 방법까지(실습은 덤!)
■ 문맥이나 사용 언어에 맞춰 특징을 처리하는 기술(즉, 특징 공학)
■ 파이썬 기반의 텍스트 분석에 필요한 강력하면서도 반복 및 확장 가능한 기술
■ 텍스트를 전처리하고 벡터화해서 고차원 특징 표현으로 바꾸기
■ 문서 분류 및 토픽 모델링 수행하기
■ 시각적인 진단을 통해 모델 선택 과정 조정하기
■ 핵심 어구 추출, 개체명 식별, 그래프 구조 추출을 통해 텍스트가 담고 있는 데이터 추론하기
■ 챗봇이나 언어로 상호작용을 하는 대화형 프레임워크 만들기
■ 스파크를 사용해 처리 능력을 늘리거나 신경망을 사용해 더 복잡한 모델로 키우기
여러분은 이 책을 통해 복잡한 텍스트 분석에 파이썬 라이브러리와 머신러닝을 사용하는 데이터 과학자의 노하우를 배우고, 복잡한 현업의 문제를 해결할 수 있는 실용적 해법을 찾을 수 있을 것입니다!
이 책의 대상 독자는 다음과 같습니다.
시리(Siri)가 사람을 완벽히 이해하고
구글이 꼭 필요한 검색 결과만 표시하는 날까지
이 책으로 열심히 공부해 볼까요?
이 책은 11월 29일에 출간됩니다!
샘플 PDF
(차례, 옮긴이 머리말, 이 책에 대하여, 베타리더 후기, 8장 '텍스트 시각화' 일부)
도서구매 사이트(가나다순)
제이펍 소식 더 보기(가나다순)
'출간 전 책 소식' 카테고리의 다른 글
머신러닝 핵심 알고리즘을 파이썬 코드와 그래프로 배운다! (0) | 2019.12.05 |
---|---|
걷는 마음으로, 부담 없이 시작하는 함수형 언어 입문! (0) | 2019.11.25 |
국내에 처음 소개되는 러스트, 그것도 공식 가이드! (0) | 2019.11.15 |
포토샵 사용자라면 누구나 한 권쯤 소장해야 할 책 (2) | 2019.11.14 |
최신 버전으로 업데이트한 프로페셔널 안드로이드(제4판)를 만나세요! (0) | 2019.10.23 |