본문 바로가기

도서 소개

단단한 강화학습: 강화학습 기본 개념을 제대로 정리한 인공지능 교과서


내용을 대폭 보강하여 20년 만에 개정된 강화학습 분야의 절대 바이블!

강화학습의 핵심 개념과 최신 알고리즘을 쉽고 명료하게 이해한다!


■ 도서 구매 사이트(가나다순)


■ 전자책 구매 사이트(가나다순)


출판사 제이펍

저작권사 MIT Press

원서명 Reinforcement Learning: An Introduction(2nd edition)(원서 ISBN: 9780262039246)

저자명 리처드 서튼, 앤드류 바르토

역자명 김성우

출판일 2020년 3월 31일

페이지 664쪽

시리즈 I♥A.I. 27(아이러브 인공지능 27)

판 형 188*245*32.3

제 본 무선(soft cover)

정 가 35,000원

ISBN 979-11-90665-17-9(93000)

키워드 머신러닝 / 딥러닝 / 인공지능 / 지도학습 / 비지도학습 / GANs / 기계학습 / 심층학습 / 심층 강화학습

분야 인공지능 / 머신러닝


관련 사이트 

관련 포스트

관련 시리즈

관련 도서

관련 파일 다운로드
예제 코드(의사 코드)

교재 검토용 증정 안내
학교 및 학원에서 교재 선정을 위해 책을 파일로 검토해보고자 하시는 분들은 다음의 페이지에서 신청 양식을 작성해주시기 바랍니다. 확인 후 연락을 드리도록 하겠습니다. http://goo.gl/vBtPo3

강의 보조자료
교재로 채택하신 분들은 메일(jeipubmarketer@gmail.com)을 보내주시면 아래의 자료를 보내드리겠습니다. 
■ 본문의 그림과 표

샘플 PDF
(차례, 옮긴이 머리말, 머리말, 1판 머리말, 표기법 안내, 베타리더 후기, 1장 '소개' 일부, 3장 '유한 마르코프 결정 과정' 일부, 7장 'n단계 부트스트랩' 일부, 16장 '적용 및 사례 연구' 일부)

정오표 페이지

■ 도서 구매 사이트(가나다순)


■ 전자책 구매 사이트(가나다순)


도서 소개

내용을 대폭 보강하여 20년 만에 개정된 강화학습 분야의 절대 바이블!

강화학습의 핵심 개념과 최신 알고리즘을 쉽고 명료하게 이해한다!


인공지능 분야에서 가장 활발하게 연구되고 있는 분야 중 하나인 강화학습은 복잡하고 불확실한 환경과 상호작용하는 학습자에게 주어지는 보상을 최대화하는 수치 계산적 학습 방법이다. 리처드 서튼과 앤드류 바르토는 이 책 《단단한 강화학습》을 통해 강화학습의 핵심적인 개념과 알고리즘을 분명하고 이해하기 쉽게 설명한다. 1판이 출간된 이후 새롭게 부각된 주제들을 추가하였고, 이미 다루었던 주제들도 최신 내용으로 업데이트하였다.


1판과 마찬가지로 2판에서도 핵심적인 온라인 학습 알고리즘을 집중적으로 다루었는데, 보다 많은 수학적 내용을 별도의 글 상자 안에 추가하였다. 이 책은 크게 다음과 같은 세 부분으로 나누어진다.


■ 첫 번째 부분에서는 정확한 해법을 찾을 수 있는 표 기반 방법만을 적용하여 가능한 한 많은 강화학습 방법을 다루었다. 첫 번째 부분에 제시되는 많은 알고리즘은 2판에서 새롭게 추가된 것인데, 여기에는 UCB, 기댓값 살사, 이중 학습이 포함된다.


■ 두 번째 부분에서는 인공 신경망이나 푸리에 기반과 같은 주제를 다루는 절이 새롭게 추가되면서 첫 번째 부분에서 제시된 방법들이 함수 근사 기반의 방법으로 확장되었고, 비활성 정책 학습과 정책 경사도 방법에 대한 내용이 더욱 풍부해졌다.


■ 세 번째 부분에서는 강화학습이 심리학 및 신경 과학과 어떤 관계인지를 다루는 새로운 장들이 추가되었고, 알파고와 알파고 제로, 아타리 게임, IBM 왓슨의 내기 전략과 같은 사례 연구를 다루는 장이 업데이트되었다. 마지막 장에서는 강화학습이 미래 사회에 미칠 영향에 대해 논의하였다.


지은이 소개

리처드 서튼(Richard S. Sutton)

앨버타 대학교의 컴퓨터 과학과 교수이자 같은 대학에서 강화학습 및 인공지능 분과의 AITF(Alberta Innovates Technology Future) 의장을 맡고 있다. 또한, 딥마인드의 우수 과학자(Distinguished Research Scientist)이기도 하다.


앤드류 바르토(Andrew G. Barto)

매사추세츠 대학교 애머스트 캠퍼스의 컴퓨터 및 정보과학 대학에서 명예 교수로 재직 중이다.


옮긴이 소개

김성우

인공위성 제어에 지도학습을 적용한 연구로 박사학위를 받았다. 지금은 인공위성 개발 업체에서 위성 충돌 회피 및 위성 영상 분석을 위한 기계학습 방법을 연구하고 있다.


차례

CHAPTER 01 소개 1

1.1 강화학습 2

1.2 예제 5

1.3 강화학습의 구성 요소 7

1.4 한계와 범위 9

1.5 확장된 예제: 틱택토 10

1.6 요약 16

1.7 강화학습의 초기 역사 17

참고문헌 27

제이펍 소식 더 보기(제이펍의 소통 채널에서 더욱 다양한 소식을 확인하세요!)