본문 바로가기

도서 소개

딥러닝을 위한 수학

심층학습의 역전파, 경사하강법을 제대로 익히기 위한 세심한 빌드업!

 

도서구매 사이트(가나다순)

교보문고 / 도서11번가 / 알라딘 / 예스이십사 / 인터파크 / 쿠팡

 

출판사 제이펍
도서명 딥러닝을 위한 수학
부제 신경망 수학 기초부터 역전파와 경사하강법까지
지은이 로널드 크노이젤
옮긴이 류광
감수자 (없음)
시리즈 IA.I. 39
출판일 2022년 8월 8일
페이지 380쪽
판  형 46배판변형(188*245*23)
제  본 무선(soft cover)
정  가 30,000원
ISBN 979-11-92469-22-5 (93000)
키워드 심층학습 / Deep Learning / 선형대수 / 파이썬 / 확률 / 통계 / 미분 / 행렬
분  야 인공지능 / 수학

 

관련 사이트

아마존 도서소개 페이지

저자 소개 페이지

 

관련 포스트
론 크노이젤의 친절한 딥러닝 수학

 

관련 시리즈
아이러브 A.I.(IA.I.)


관련 파일 다운로드
예제 코드 다운로드

관련 도서

단단한 심층강화학습

심층 강화학습 인 액션


교재 검토용 증정 안내
■ 학교 및 학원에서 교재 선정을 위해 책을 파일로 검토해보고자 하는 분들은 다음 페이지에서 신청 양식을 작성해주시기 바랍니다. 확인 후 연락을 드리겠습니다. https://goo.gl/vBtPo3

강의 보조 자료(교재로 채택하신 분들은 메일(textbook@jpub.kr)을 보내주시면 다음의 자료를 보내드리겠습니다.)
본문의 그림과 표

미리 보기(앞부속물, 2장 '확률 1부', 6장 '선형대수 2부' 일부)

Sample_딥러닝을위한수학.pdf
3.87MB

정오표 페이지

[딥러닝을 위한 수학]_오탈자

 

도서구매 사이트(가나다순)

교보문고 / 도서11번가 / 알라딘 / 예스이십사 / 인터파크 / 쿠팡

 

도서 소개

 

확률, 통계, 선형대수, 미분, 행렬로 역전파, 경사하강법 제대로 정복하기

심층학습의 위력을 제대로 이해하려면 심층학습의 기본이 되는 수학 개념을 확실히 파악해야 한다. 이 책은 심층학습을 이해하는 데 꼭 필요한 확률, 통계, 선형대수, 미분에 관한 실무 지식을 제공하며, 각 수학 분야의 개념에 대해 실행가능한 파이썬 예제 코드로 설명한다.

 

이 책에서 다루는 검증 가능한 예제들은 순수 수학과 심층학습 응용의 틈새를 메우는 역할을 한다. 벡터와 행렬, 확률 분포 등의 근본적인 주제를 설명한 뒤에 행렬 미분과 같은 좀 더 심화한 개념으로 나아가며, 마지막에는 모든 논의를 통합해서 심층학습의 필수 알고리즘인 역전파와 경사하강법을 다룬다.

 

■ 확률 법칙들과 확률분포, 베이즈 확률

■ 통계를 이용해서 데이터 집합을 파악하고 모형을 평가하는 방법

■ 벡터와 행렬을 다루는 방법과 데이터가 벡터와 행렬의 형태로 신경망을 통과하는 과정

■ 선형대수를 이용한 주성분 분석(PCA)과 특잇값 분해(SVD) 구현

■ 역전파, 경사하강법, 여러 최적화 기법(SGD, Adam, RMSprop, Adagrad/Adadelta)

 

지은이 소개

로널드 크노이젤(Ronald T. Kneusel)

2003년부터 업계에서 심층학습 개발자로 일해오면서, 2016년 콜로라도 대학교 볼더 캠퍼스에서 기계학습 전공 박사학위를 받았다. 이 책 외에 세 권의 책 《Practical Deep Learning: A Python-Based Introduction(No Starch Press), Numbers and Computers(Springer), Random Numbers and Computers(Springer)를 썼다.

 

옮긴이 소개

류광

《컴퓨터 프로그래밍의 예술》 시리즈와 《UNIX 고급 프로그래밍》 제2판·제3, Game Programming Gems》 시리즈를 비롯해 80여 종의 다양한 IT 전문서를 옮긴 전문 번역가이다. 수학 관련 번역서로는 《구체 수학》, 3D 게임 프로그래밍 & 컴퓨터 그래픽을 위한 수학》 제1판·제2판 등이 있고, 심층학습 관련 번역서로는 《인공지능: 현대적 접근방식》 제4, 《심층

학습》, 《신경망과 심층 학습》 등이 있다.

 

추천사

로널드 크노이젤은 심층학습의 수학에 관한 편리하고 간결한 지침서를 저술했다. 신경망과 기계학습 분야의 학생, 연구자,
실무자는 이 책을 항상 소지하고 필요할 때마다 수학 공식과 알고리즘을 찾아볼 수 있을 것이다. 수학 공식뿐만 아니라 각
종 그래프와 도표, 파이썬 예제 코드까지 갖춘 이 책은 멋진 수학 입문서다.

데이비드 메이즐(David S. Mazel)
Regulus-Group의 수석 엔지니어


《딥러닝을 위한 수학》이 다른 비슷한 책들보다 뛰어난 점은 심층학습의 모든 것을 가르치는 대신, 심층학습에 깔린 수학
적 기초를 충실하게 제공하는 데 초점을 두었다는 것이다. 이 책은 필수 수학 개념을 적절한 순서로 설명한다. 심층학습에
정통하고자 하는 독자에게 이 책의 계단식 접근 방식은 큰 도움이 될 것이다.

에드 스콧(Ed Scott)
솔루션 아키텍트이자 IT 애호가

 

차례

CHAPTER 1 실습 환경 설정 1

1.1 도구 모음 설치 2

1.1.1 리눅스 2 / 1.1.2 macOS 3 / 1.1.3 Windows 4

1.2 NumPy 5

1.2.1 배열 정의 6 / 1.2.2 데이터 형식 7 / 1.2.3 2차원 배열 8

1.2.4 0 배열과 1 배열 8 / 1.2.5 고급 색인 접근 9 / 1.2.6 디스크 읽기/쓰기 12

1.3 SciPy 12

1.4 Matplotlib 14

1.5 Scikit-Learn 16

1.6 요약 18

 

CHAPTER 2 확률 1 19

2.1 기본 개념들 20

2.1.1 표본 공간과 사건 20 / 2.1.2 확률 변수 21 / 2.1.3 인간은 확률에 약하다 22

2.2 확률의 법칙들 24

2.2.1 단일 사건의 확률 24 / 2.2.2 합의 법칙 27 / 2.2.3 곱의 법칙 28

2.2.4 합의 법칙 보충 29 / 2.2.5 생일 역설 30 / 2.2.6 조건부 확률 34

2.2.7 전체 확률 35

2.3 결합 확률과 주변 확률 36

2.3.1 결합 확률표 37 / 2.3.2 확률의 연쇄법칙 42

2.4 요약 45

더보기

CHAPTER 3 확률 2 47

3.1 확률 분포 47

3.1.1 히스토그램과 확률 48 / 3.1.2 이산 확률 분포 52 / 3.1.3 연속 확률 분포 58

3.1.4 중심 극한 정리 62 / 3.1.5 큰 수의 법칙 64

3.2 베이즈 정리 66

3.2.1 다시 살펴보는 암 진단 예제 67 / 3.2.2 사전 확률의 갱신 68

3.2.3 기계학습의 베이즈 정리 70

3.3 요약 73

 

CHAPTER 4 통계 75

4.1 데이터의 종류 76

4.1.1 명목형 자료 76 / 4.1.2 순서형 자료 76 / 4.1.3 구간 자료 76

4.1.4 비율 자료 77 / 4.1.5 명목형 자료와 심층학습 78

4.2 요약 통계량 78

4.2.1 평균과 중앙값 79 / 4.2.2 변동의 측도 83

4.3 분위수와 상자 그림 87

4.4 결측 자료 92

4.5 상관관계 96

4.5.1 피어슨 상관계수 96 / 4.5.2 스피어먼 상관계수 100

4.6 가설 검정 103

4.6.1 가설 104 / 4.6.2 t-검정 105 / 4.6.3 -휘트니 U 검정 111

4.7 요약 113

 

CHAPTER 5 선형대수 1 115

5.1 스칼라, 벡터, 행렬, 텐서 116

5.1.1 스칼라 116 / 5.1.2 벡터 116 / 5.1.3 행렬 118 / 5.1.4 텐서 119

5.2 텐서 산술 연산 122

5.2.1 배열 연산 122 / 5.2.2 벡터 연산 124

5.2.3 행렬 곱셈 134 / 5.2.4 크로네커 곱 140

5.3 요약 141

 

CHAPTER 6 선형대수 2 143

6.1 정방행렬 144

6.1.1 왜 정방행렬인가? 144 / 6.1.2 전치, 대각합, 거듭제곱 146

6.1.3 특별한 정방행렬들 148 / 6.1.4 단위행렬 149 / 6.1.5 행렬식 151

6.1.6 역행렬 155 / 6.1.7 대칭행렬, 직교행렬, 유니터리 행렬 157

6.1.8 대칭행렬의 정부호성 158

6.2 고윳값과 고유벡터 159

6.2.1 고윳값과 고유벡터 구하기 160

6.3 벡터 노름과 거리 함수 164

6.3.1 L-노름과 거리 함수 164 / 6.3.2 공분산 행렬 166

6.3.3 마할라노비스 거리 169 / 6.3.4 쿨백-라이블러 발산값 172

6.4 주성분 분석 174

6.5 특잇값 분해와 유사 역행렬 178

6.5.1 특잇값 분해 예제 179 / 6.5.2 두 가지 용도 181

6.6 요약 183

 

CHAPTER 7 미분 185

7.1 기울기(슬로프) 186

7.2 도함수 188

7.2.1 도함수의 공식적인 정의 188 / 7.2.2 기본 미분법 190

7.2.3 삼각함수 미분법 195 / 7.2.4 지수함수와 로그함수의 미분법 198

7.3 함수의 극솟값과 극댓값 201

7.4 편미분 205

7.4.1 혼합 편미분 207 / 7.4.2 편미분 연쇄법칙 208

7.5 기울기(그래디언트) 210

7.5.1 기울기 계산 210 / 7.5.2 기울기의 시각화 213

7.6 요약 216

 

CHAPTER 8 행렬 미분 217

8.1 공식들 218

8.1.1 스칼라 인수 벡터 함수 219 / 8.1.2 벡터 인수 스칼라 함수 221

8.1.3 벡터 인수 벡터 함수 221 / 8.1.4 스칼라 인수 행렬 함수 222

8.1.5 행렬 인수 스칼라 함수 223

8.2 항등식 224

8.2.1 벡터 인수 스칼라 함수 관련 항등식 224

8.2.2 스칼라 인수 벡터 함수 관련 항등식 226

8.2.3 벡터 인수 벡터 함수 관련 항등식 227

8.2.4 행렬 인수 스칼라 함수 관련 항등식 228

8.3 야코비 행렬과 헤세 행렬 230

8.3.1 야코비 행렬 231 / 8.3.2 헤세 행렬 238

8.4 행렬 미분 예제 몇 가지 245

8.4.1 성분별 연산의 도함수 245 / 8.4.2 활성화 함수의 도함수 246

8.5 요약 248

 

CHAPTER 9 신경망의 데이터 흐름 249

9.1 데이터 표현 250

9.1.1 전통적인 신경망 250 / 9.1.2 심층 합성곱 신경망 251

9.2 전통적인 신경망의 데이터 흐름 254

9.3 합성곱 신경망의 데이터 흐름 259

9.3.1 합성곱 259 / 9.3.2 합성곱 층 265 / 9.3.3 풀링 층 268

9.3.4 완전 연결층 269 / 9.3.5 합성곱 신경망의 데이터 흐름 269

9.4 요약 272

 

CHAPTER 10 역전파 275

10.1 역전파란 무엇인가? 276

10.2 직접 계산해 보는 역전파 277

10.2.1 편미분 유도 279 / 10.2.2 파이썬 구현 281

10.2.3 신경망 모형의 훈련과 시험 286

10.3 완전 연결 신경망의 역전파 288

10.3.1 오차의 역전파 288 / 10.3.2 가중치와 치우침 값의 편미분 계산 292

10.3.3 파이썬 구현 294 / 10.3.4 구현 적용 299

10.4 계산 그래프 302

10.5 요약 305

 

CHAPTER 11 경사하강법 307

11.1 기본 개념 308

11.1.1 1차원 경사하강법 308 / 11.1.2 2차원 경사하강법 312

11.2 확률적 경사하강법 318

11.3 운동량 321

11.3.1 운동량이란? 321 / 11.3.2 운동량을 도입한 1차원 경사하강법 323

11.3.3 운동량을 도입한 2차원 경사하강법 325

11.3.4 운동량을 이용한 신경망 학습 326 / 11.3.5 네스테로프 운동량 333

11.4 적응적 경사하강법 336

11.4.1 RMSprop 336 / 11.4.2 AdaGrad ADADELTA 337

11.4.3 Adam 338 / 11.4.4 최적화 기법에 관한 몇 가지 생각 340

11.5 요약 341

11.6 맺음말 342

 

부록: 더 나아가기 343

확률과 통계 343

선형대수 344

미적분 345

심층학습 345


 

 

제이펍 소식 더 보기(제이펍의 소통 채널에서 더욱 다양한 소식을 확인하세요!)

네이버 책 / 포스트 / 유튜브 / 인스타그램 / 트위터 / 페이스북