본문 바로가기

출간 전 책 소식

빅데이터 시대, 텍스트 분석도 머신러닝으로?!

뉴스나 연설 그리고 소셜 미디어에서 이뤄지는 사적인 대화에 이르기까지 자연어는 가장 널리 쓰이면서도 활용률은 낮은 데이터 중 하나입니다. 자연어가 일정하게 흐르지 않고 상황에 맞춰 늘 변하며 적응하기 때문인데요. 게다가 자연어는 정해진 '규칙(rule)'에 따라 정의되는 것이 아니라 '용례(use)'에 따라 정의되므로 텍스트 분석 응용 프로그램을 창의적으로 만들어 사용해야 자연어가 담고 있는 진짜 의미를 해독할 수 있습니다. 


그래서!

어떻게 하면 텍스트 분석과 자연어 처리를

잘할 수 있을까요?


그 방법을 저명한 세 명의 데이터 과학자가 안내합니다. 


《파이썬으로 배우는 응용 텍스트 분석

파이썬 라이브러리로 학습하는 자연어 처리와 머신러닝 응용 테크닉!


이 책은 풍부한 과학 계산과 수치 계산이 가능한 사이킷런, NLTK, Gensim, spaCy, NetworkX, Yellowbrick 등의 파이썬 라이브러리를 사용해 텍스트 분석을 할 수 있도록 머신러닝을 응용하는 데 초점을 맞춥니다.



또한, 이 책은 다음과 같은 내용에 집중합니다.


자연어 처리의 기본 개념은 물론, 머신러닝을 이용한 최첨단 NLP 방법까지(실습은 덤!)

 문맥이나 사용 언어에 맞춰 특징을 처리하는 기술(즉, 특징 공학)

 파이썬 기반의 텍스트 분석에 필요한 강력하면서도 반복 및 확장 가능한 기술

 텍스트를 전처리하고 벡터화해서 고차원 특징 표현으로 바꾸기

 문서 분류 및 토픽 모델링 수행하기

 시각적인 진단을 통해 모델 선택 과정 조정하기 

 핵심 어구 추출, 개체명 식별, 그래프 구조 추출을 통해 텍스트가 담고 있는 데이터 추론하기

 챗봇이나 언어로 상호작용을 하는 대화형 프레임워크 만들기

 스파크를 사용해 처리 능력을 늘리거나 신경망을 사용해 더 복잡한 모델로 키우기


여러분은 이 책을 통해 복잡한 텍스트 분석에 파이썬 라이브러리와 머신러닝을 사용하는 데이터 과학자의 노하우를 배우고, 복잡한 현업의 문제를 해결할 수 있는 실용적 해법을 찾을 수 있을 것입니다!


이 책의 대상 독자는 다음과 같습니다.



시리(Siri)가 사람을 완벽히 이해하고

구글이 꼭 필요한 검색 결과만 표시하는 날까지

이 책으로 열심히 공부해 볼까요?


이 책은 11월 29일에 출간됩니다!



샘플 PDF 

(차례, 옮긴이 머리말, 이 책에 대하여, 베타리더 후기, 8장 '텍스트 시각화' 일부)

파이썬으로배우는응용텍스트분석_sample.pdf


도서구매 사이트(가나다순)


제이펍 소식 더 보기(가나다순)

 네이버 책     포스트     유튜브     인스타그램     트위터     페이스북