본문 바로가기

도서 소개

검색을 위한 딥러닝: 심층 신경망을 활용하는 차세대 검색 엔진 개발

딥러닝을 활용해 더 스마트하고 인간 친화적인 검색 엔진을 만드는 기술의 모든 것!

딥러닝 기술을 활용해서 한층 더 진화된 검색 엔진을 완성한다!

신경망을 이용한 인공지능 검색 시스템의 원리와 활용!

도서구매 사이트(가나다순)

[교보문고] [도서11번가] [반디앤루니스] [알라딘] [영풍문고] [예스이십사] [인터파크] [쿠팡]

 

■ 전자책 구매 사이트(가나다순)

[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사] [인터파크]

 

출판사 제이펍

저작권사 Manning

원서명 Deep Learning For Search(원서 ISBN: 9781617294792)

저자명 토마소 테오필리

역자명 박진수

출판일 2020년 3월 12일

페이지 384

시리즈 I♥A.I. 26(아이러브 인공지능 26)

판 형 188*245*19.1

제 본 무선(soft cover)

정 가 29,000원

ISBN 979-11-88621-97-2(93000)

키워드 딥러닝 / 심층 신경망 / 머신러닝 / Deeplearning4j / world2vec / 지도학습 / 비지도학습 / 재귀 신경망 / 루씬 / LSTM / 매장 / TF-IDF / 순위지정 / 인코더 디코더 모델 / CNN

분 야 인공지능 / 딥러닝

 

관련 사이트

저작권사 도서 소개 페이지

아마존 도서 소개 페이지

 

관련 포스트

2020/03/03 - [출간전 책소식] - 딥러닝을 검색엔진에 적용한다면 어떤 일이 벌어질까요?

 

관련 시리즈

I♥A.I. 시리즈

 

관련 도서

파이썬으로 배우는 응용 텍스트 분석

알파제로를 분석하며 배우는 인공지능

 

관련 파일 다운로드

예제 코드(저작권사 홈페이지)

 

 

강의 보조자료

교재로 채택하신 분들은 메일(jeipubmarketer@gmail.com)을 보내주시면 아래의 자료를 보내드리겠습니다.

■ 본문의 그림과 표

샘플 PDF

(옮긴이 머리말, 추천사, 머리말, 감사의 말, 이 책에 대하여, 베타리더 후기, 1장 ' 신경망을 이용한 검색' 일부, 3장 '일반 검색에서 텍스트 생성까지' 일부, 5장 '단어 매장을 사용해 검색 결과의 순위지정하기' 일부)

검색을위한딥러닝_sample.pdf
다운로드

정오표 페이지

(등록되는 대로 안내해 드리겠습니다.)

 

도서구매 사이트(가나다순)

[교보문고] [도서11번가] [반디앤루니스] [알라딘] [영풍문고] [예스이십사] [인터파크] [쿠팡]

 

■ 전자책 구매 사이트(가나다순)

[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사] [인터파크]

도서 소개

딥러닝을 활용해 더 스마트하고 인간 친화적인 검색 엔진을 만드는 기술의 모든 것!

딥러닝 기술을 활용해서 한층 더 진화된 검색 엔진을 완성한다!

신경망을 이용한 인공지능 검색 시스템의 원리와 활용!

 

딥러닝을 활용하면 검색어가 부정확하거나, 색인이 심하게 꼬여 있거나, 메타데이터가 거의 없는

상태에서도 이미지 검색과 같은 가장 까다로운 검색까지 처리할 수 있다. 또한, DL4J나 텐서플로와 같은 최신 도구를 사용하면 데이터 과학이나 자연어 처리에 대한 배경지식이 깊지 않아도 강력한 딥러닝 기술을 응용할 수 있다.

독자는 이 책을 통해 신경망을 사용하여 검색 결과를 향상시키는 방법을 배울 수 있다. 이 책에서는 색인 처리 및 순위지정과 같은 기본 검색 기술이 딥러닝과 어떤 관련성이 있는지를 검토하는 것부터 시작한다. 그런 다음, 아파치 루씬과 DL4J사용하는 검색 기능을 딥러닝 기술로 보강해 보는 심층 예제를 다루고, 더 나아가서 이미지 검색, 사용자 질의 내용 번역, 학습하는 동안 개선되는 검색 엔진 설계와 같은 고급 주제를 살펴본다.

이 책의 주요 내용

동의어를 생성해 쿼리 보충하기

정확하고 연관성 높은 결과가 먼저 나오게 순위지정하기

여러 외국어를 사용해서 검색하기

이미지 내용을 가지고 이미지 검색하기

추천 기능을 제공해 검색 돕기

지은이 소개

토마소 테오필리(Tommaso Teofili)

오픈 소스와 머신러닝에 열정을 보이는 소프트웨어 엔지니어다. 아파치 소프트웨어 재단의 일원으로서 정보 검색 분야(루씬, 솔라 등)부터 자연어 처리와 OpenNLP, Joshua, UIMA 등에 이르는 다양한 오픈 소스 프로젝트에 기여하고 있다.

현재 어도비(Adobe)에서 검색 및 색인화 기반 컴포넌트를 개발 중이며, 자연어 처리, 정보 검색 및 딥러닝 분야를 연구하고 있다. 베를린에서 열리는 버즈워즈(Buzzwords), 국제 컴퓨터 과학 회의, 아파치콘(ApacheCon), 이클립스콘(EclipseCon) 등을 포함한 여러 회의에서 검색 기술과 머신러닝 기술의 융합을 제안했다. 트위터 @teofili에서 그를 만나 볼 수 있다.

옮긴이 소개

박진수

다양한 정보기술 분야 경력과 저술/번역 경험을 바탕으로 IT ·복합 사업을 꿈꾸는, 1인 회사 리율의 대표다. 옮긴 책으로는 파이썬으로 배우는 응용 텍스트 분석, R로 배우는 텍스트 마이닝, 케라스 창시자의 딥러닝 with R, 모두를 위한 실용 전자공학, 해킹 일렉트로닉스, ggplot2등이 있다.

차례

PART I 검색이 딥러닝을 만나다 1

CHAPTER 1 신경망을 이용한 검색 3

1.1 신경망과 딥러닝 5

1.2 머신러닝이란? 8

1.3 검색 시에 딥러닝으로 할 수 있는 일은? 10

1.4 딥러닝 학습을 위한 계획도 14

1.5 유용한 정보 꺼내기 16

1.5.1 텍스트, 토큰, 용어, 검색에 관한 기초 지식 18

1.5.2 연관도 우선 28

1.5.3 고전적인 검색 모델 29

1.5.4 정밀도와 재현율 30

1.6 미해결 문제들 31

1.7 검색 엔진 블랙박스 열기 32

1.8 구조의 손길을 펼치는 딥러닝 34

1.9 색인아, 뉴런을 만나 주지 않을래? 38

1.10 신경망 훈련 39

1.11 신경 검색의 약속들 42

더보기

CHAPTER 2 동의어 생성 44

2.1 동의어 확장 소개 45

2.1.1 왜 동의어인가? 47

2.1.2 어휘 기반 동의어 일치 49

2.2 맥락의 중요성 60

2.3 순방향 신경망 62

2.4 word2vec 사용 66

2.4.1 Deeplearning4jword2vec 끼워 쓰기 76

2.4.2 Word2vec 기반 동의어 확장 77

2.5 평가 및 비교 80

2.6 프로덕션 시스템에 대해 고려할 사항 81

2.6.1 동의어 대 반의어 83

PART 2 검색 엔진에 신경망들 던져 넣기 87

CHAPTER 3 일반 검색에서 텍스트 생성까지 89

3.1 정보 요구 대 쿼리: 틈새를 메우는 것 91

3.1.1 대안 쿼리 생성 91

3.1.2 데이터 준비 94

3.1.3 데이터 생성 준비 102

3.2 시퀀스 학습 103

3.3 재귀 신경망 104

3.3.1 RNN 내부 구조와 작동 방식 107

3.3.2 장기 의존성 111

3.3.3 장단기 기억망 112

3.4 비지도 학습 방식으로 텍스트를 생성하기 위한 LSTM 113

3.4.1 비지도 쿼리 확장 122

3.5 비지도 텍스트 생성에서 지도 텍스트 생성까지 126

3.5.1 시퀀스--시퀀스 모델링 126

3.6 프로덕션 시스템에 대해 고려해야 할 점 130

CHAPTER 4 그럴듯한 쿼리들 제안하기 133

4.1 쿼리 제안 생성 134

4.1.1 쿼리 작성 중에 제안하기 135

4.1.2 사전 기반 제안 136

4.2 루씬 룩업 API 136

4.3 분석된 내용을 활용하는 제안기 141

4.4 언어 모델 사용 148

4.5 내용 기반 제안기 152

4.6 신경 언어 모델 154

4.7 제안용 문자 기반 신경 언어 모델 156

4.8 LSTM 언어 모델 조율 160

4.9 단어 매장을 이용한 제안 다양화 169

CHAPTER 5 단어 매장을 사용해 검색 결과의 순위지정하기 173

5.1 순위지정의 중요성 174

5.2 검색 모델 177

5.2.1 TF-IDF와 벡터 공간 모델 179

5.2.2 루씬에서 문서의 순위지정하기 183

5.2.3 확률 모델 186

5.3 신경 정보 검색 188

5.4 단어 벡터에서 문서 벡터까지 189

5.5 평가 및 비교 196

5.5.1 평균 단어 매장 기준 유사도 198

CHAPTER 6 순위지정 및 추천을 위한 문서 매장 203

6.1 단어 매장으로부터 문서 매장까지 204

6.2 순위지정 시 단락 벡터 사용 208

6.2.1 단락 벡터 기반 유사도 211

6.3 문서 매장과 연관 내용 211

6.3.1 검색, 추천 그리고 연관 내용 212

6.3.2 빈출 용어들을 사용해 유사한 내용 찾기 214

6.3.3 단락 벡터를 사용해 유사한 내용 검색 224

6.3.4 인코더-디코더 모델에서 벡터를 사용해 유사한 내용 검색 227

PART 3 한 걸음 더 나아가다 231

CHAPTER 7 여러 언어로 검색하기 233

7.1 언어가 서로 다른 사용자들에게 서비스하기 234

7.1.1 문서 번역 대 쿼리 번역 235

7.1.2 교차 언어 검색 237

7.1.3 루씬 기반 다중 언어 쿼리 239

7.2 통계적 기계 번역 241

7.2.1 정렬 244

7.2.2 단락 기반 번역 245

7.3 병렬 말뭉치를 가지고 일하기 246

7.4 신경 기계 번역 249

7.4.1 인코더-디코더 모델 250

7.4.2 DL4J에서 기계 번역을 하기 위한 인코더-디코더 254

7.5 여러 언어를 위한 단어 매장 및 문서 매장 261

7.5.1 선형 사영 1개 국어 사용 매장 261

CHAPTER 8 내용 기반 이미지 검색 268

8.1 이미지 내용과 검색 270

8.2 되돌아보기: 텍스트 기반 이미지 검색 272

8.3 이미지 이해하기 275

8.3.1 이미지 표현 277

8.3.2 특징 추출 280

8.4 이미지 표현을 위한 딥러닝 288

8.4.1 CNN 290

8.4.2 이미지 검색 298

8.4.3 국소성 민감 해싱 304

8.5 레이블이 없는 이미지 다루기 308

CHAPTER 9 성능 엿보기 314

9.1 성과 및 딥러닝의 약속 315

9.1.1 모델 설계로부터 모델 산출로 316

9.2 색인과 뉴런이 협동하게 하기 334

9.3 데이터 스트림 작업 337

찾아보기 346

제이펍 소식 더 보기(제이펍의 소통 채널에서 더욱 다양한 소식을 확인하세요!)

네이버 책 포스트 유튜브 인스타그램 트위터 페이스북