2019/05/17 썸네일형 리스트형 세상의 모든 텍스트를 통찰하라! 데이터 과학을 업으로 삼는다면 데이터가 그 어느 때보다 빠르게, 지속적으로 생성된다는 사실에 이견이 없을 것입니다. 데이터 분석가는 대부분 숫자가 채워진 테이블, 즉 직교형으로 정돈된 데이터를 처리하도록 교육받지만, 최근에 급증하는 데이터 중 대부분은 정형화되지 않았고, 그 안에 많은 텍스트마저 들어 있습니다. 게다가 데이터 랭글링(data wrangling)과 데이터 시각화(data visualization)를 위한 방법을 알고 있더라도 이 같은 방법을 텍스트에 쉽게 적용하기는 힘들며, 심지어 분석 분야에서 일하는 많은 분석가도 자연어를 간단히 해석하는 일조차 훈련받지 못하기도 합니다. 그래서 지금 소개할 책을 집필한 줄리아와 데이비드는 텍스트 데이터를 정형화하기 위해 새로운 방법을 개발했습니다. 바로.. 더보기 이전 1 다음