수식 없이 술술 읽으면서 이해하는 생성형 AI 데이터 생성 기술의 핵심 원리
일본 최고의 AI 전문가 오카노하라 다이스케는 비전문가도 이해할 수 있도록 수식 없이 글과 그림만으로 생성형 AI의 구조를 설명하는 이 책을 집필했다. 생성형 AI의 역사부터 플로, 확산 모델과 플로 매칭, 최적 운송까지, ‘기술을 둘러싼 풍부한 맥락을 제공’한다고 평가받는 베테랑 저자의 친절한 해설과 함께 오늘날 IT의 중심에 선 생성형 AI의 핵심을 제대로 이해해보자.
도서구매 사이트(가나다순)
[교보문고] [도서11번가] [알라딘] [예스이십사] [인터파크] [쿠팡] |
출판사 제이펍
저작권사 岩波書店
원서명 生成AIのしくみ 〈流れ〉が画像・音声・動画をつくる (9784000297288)
도서명 생성형 AI의 구조
부제 수식 없이도 정확히 이해하는 이미지, 음성, 비디오를 실현하는 플로의 핵심 원리
지은이 오카노하라 다이스케
옮긴이 정원창
감수자 (없음)
시리즈 (없음)
출판일 2025. 05. 13
페이지 132쪽
판 형 크라운판변형(170*225*8.1)
제 본 무선(soft cover)
정 가 18,000원
ISBN 979-11-94587-23-1 (93000)
키워드 플로, 확산, 확산모델, LLM, 생성형AI, 딥러닝, 데이터과학, 머신러닝, 인공지능, 거대언어모델
분 야 인공지능 / 알고리즘
관련 사이트
■ 아마존 도서 페이지
■ 저작권사 도서 페이지
관련 시리즈
■ (없음)
관련 포스트
■ 2025.04.22 - [출간 전 책 소식] - 수학 없이 읽는 확산 모델
관련 도서
■ 2024.07.02 - [도서 소개] - 확산 모델의 수학
관련 파일 다운로드
■ (없음)
강의 보조 자료(교재로 채택하신 분들은 https://jpub.tistory.com/notice/1076을 통해 다음 자료를 요청하실 수 있습니다.)
■ 본문의 그림과 표
미리보기(앞부속, 본문 일부)
정오표 페이지
■ (등록되는 대로 링크를 걸겠습니다.)
도서구매 사이트(가나다순)
[교보문고] [도서11번가] [알라딘] [예스이십사] [인터파크] [쿠팡] |
도서 소개
글과 그림만 가지고 생성형 AI를 설명하는 책
플로(flow)에 기반한 생성 기술, 특히 확산 모델은 이미지, 오디오, 비디오 생성 등 많은 분야에서 두각을 나타냈다. 일본 최고의 AI 전문가 오카노하라 다이스케는 《확산 모델의 수학》을 집필해 확산 모델을 수학적으로 명확히 해설한 바 있고, 이번에는 수학 공식 없이 글과 그림만으로 생성형 AI 전반을 설명하는 《생성형 AI의 구조》을 썼다.
비전문가도 이해할 수 있도록 생성형 AI의 역사부터 플로, 확산 모델과 플로 매칭, 최적 운송, 향후 전망까지 술술 읽히게 저술했다. 수식을 배제하는 대신 우리가 사는 세계에서 접할 수 있는 일상적인 비유를 활용하는 편으로, 예를 들어 확산 모델에 대해서는 다음과 같이 설명을 시작한다.
“물 표면에 잉크로 글자를 썼다고 가정해봅시다. 이 잉크로 쓰여진 글자는 시간이 지남에 따라 서서히 풀어져갈 것이고 최종적으로는 잉크가 물 전체에 균일하게 섞이게 됩니다. (…) 만약 이 잉크의 확산 과정을 반대 방향으로 재현할 수 있다면, 잉크가 물에 균일하게 섞인 상태로부터 다시 잉크로 문자가 쓰여진 상태로 되돌릴 수 있습니다. 즉, 질서를 가지고 있는 대상에 노이즈가 더해지면서 서서히 파괴되어 완전한 무질서가 되는 과정을 역방향으로 거슬러 올라감으로써 무질서로부터 질서를 만들어내는 과정, 즉 생성을 실현할 수 있지 않을까 하는 생각인 것입니다.“
오카노하라 다이스케는 일본 최대 AI 유니콘 Preferred Networks의 공동창업자로 유명하지만 10여 권 이상의 전문서를 집필해 ‘기술을 둘러싼 풍부한 맥락을 제공’한다는 평가를 받는 베테랑 저자이기도 하다. 그의 친절하면서도 정확한 해설과 함께 오늘날 IT의 중심에 선 생성형 AI의 구조를 제대로 이해해보자.
지은이 소개
오카노하라 다이스케(岡野原 大輔)
도쿄 대학 대학원 정보이공학계연구과 컴퓨터과학 전공 정보이공학 박사. 2006년 Preferred Infrastructure를 공동 창업했고, 2014년 Preferred Networks를 공동 창업해 대표이사 겸 최고연구책임자를 맡고 있다. 공저 포함 12권의 AI 도서를 집필했고, 2023년 《확산 모델의 수학》(제이펍, 2024)으로 32회 오카와 출판상을 받았다.
옮긴이 소개
정원창
전자공학과 전산학을 공부하고 국내외의 크고 작은 하드웨어와 소프트웨어 회사에서 경험을 쌓았다. 현재는 자연어 처리에 중점을 둔 머신러닝 엔지니어로 일하고 있다. 옮긴 책으로 《AI 딥 다이브》, 《인사이드 머신러닝 인터뷰》, 《개발자의 하루를 바꾸는 코파일럿 & 챗GPT》(이상 한빛미디어) 등이 있다.
차례
옮긴이 머리말 ix
한국의 독자들에게 x
머리말 xi
CHAPTER 1 생성형 AI 1
생성형 AI란 무엇인가 1
지시와 조건에 따르는 생성 2
이전에는 생성하기 어려웠던 데이터를 생성 가능 3
규칙 기반에서 머신러닝으로 5
생성 작업은 특히 어려운 머신러닝 문제 7
데이터 생성은 광활한 바다에서 섬을 찾는 것과 같은 작업 9
광활하고 기묘한 고차원 공간 11
생성에는 올바른 출력이 하나만이 아님 13
다양체 가설: 저차원에 들어 있는 데이터 15
대칭성: 변환에 대한 불변성이 존재하는 데이터 18
구성성: 여러 부분의 조합으로 만들어지는 데이터 20
[COLUMN] 데이터가 가지는 특성은 사람이 제공하는 것인가, 아니면 스스로 학습하는 것인가? 21
요약 22
CHAPTER 2 생성형 AI의 역사 23
기억의 메커니즘 23
이징 모델에서 홉필드 네트워크로 24
에너지 기반 모델 28
자연스럽게 연상 기억을 실현하는 에너지 기반 모델 29
에너지와 확률의 상관관계: 볼츠만 분포 31
랑주뱅 몬테카를로 방법의 원리 32
에너지 기반 모델의 치명적인 문제 33
[COLUMN] 현실 세계는 거대한 시뮬레이터 34
공간 전체의 정보를 지배하는 분배함수 35
숨겨진 정보로부터 생성되는 데이터 37
생성을 위해서는 인식이 필요 38
변분 오토인코더(VAE) 40
잠재변수 모델의 문제 42
[COLUMN] 생성적 적대 신경망(GAN) 43
[COLUMN] 자기 회귀 모델 43
[COLUMN] 2024년 노벨상 44
요약 45
CHAPTER 3 플로를 사용하는 생성 47
플로란 47
연속방정식: 물질은 갑자기 사라지거나 워프하지 않음 49
플로를 사용하여 만드는 복잡한 확률분포 51
분배함수를 구할 필요가 없는 플로 기반 모델 53
정규화 플로와 연속 정규화 플로 55
플로를 따라 구한 가능도가 최대화되도록 학습 55
플로에 따라 데이터를 생성 57
복잡한 생성 문제를 간단한 부분 생성 문제로 분해하는 플로 58
플로 모델링 60
플로 결과 계산 62
정규화 플로의 과제 64
요약 65
CHAPTER 4 확산 모델과 플로 매칭 67
확산 모델의 발견 67
일반적인 확산 현상 68
[COLUMN] 브라운 운동 69
확산 모델이란 70
확산 과정이 만들어내는 플로 = 스코어 72
스코어와 에너지의 관계 73
시간과 함께 바뀌어가는 스코어 74
디노이징 스코어 매칭 76
시뮬레이션 프리 학습은 일부만을 대상으로 학습 가능 78
확산 모델에 의한 학습과 생성 요약 79
확산 모델에 의해 만들어지는 플로의 특징 79
확산 모델과 잠재변수 모델의 관계 80
데이터 생성의 계통 발생 트리를 자동으로 학습 81
확산 모델은 에너지 기반 모델 82
확산 모델은 플로를 사용하는 생성 모델 82
플로 매칭: 플로를 모아서 만드는 복잡한 플로 83
최적 운송 83
최적 운송을 사용하는 생성 85
최적 운송을 직접 구하는 것은 계산량이 너무 큼 85
플로 매칭의 학습 86
플로 매칭의 발전 88
조건부 생성은 조건부 플로로 실현 88
잠재 확산 모델: 원래 데이터를 잠재공간으로 변환하여 품질 개선 90
요약 91
CHAPTER 5 플로를 사용한 기술의 향후 전망 93
일반화의 수수께끼 해명 93
대칭성을 고려한 생성 95
어텐션 메커니즘과 플로 96
플로에 의한 수치 최적화 96
언어와 같은 이산 데이터 생성 97
뇌의 계산 메커니즘과의 접점 99
플로에 의한 생성의 미래 99
APPENDIX A 머신러닝 키워드 101
확률과 생성 모델 101
최대 가능도법 102
머신러닝 103
머신러닝의 메커니즘 104
매개변수 조정 = 학습 105
신경망 106
유한한 학습 데이터로부터 무한한 데이터에 적용할 수 있는 규칙을 얻는 일반화 106
APPENDIX B 참고 문헌 109
2장 110
3장 112
4장 112
5장 114
찾아보기 117
제이펍 소식 더 보기(제이펍의 소통 채널에서 더욱 다양한 소식을 확인하세요!)
블로그 유튜브 인스타그램 트위터 페이스북 |
'도서 소개' 카테고리의 다른 글
실무에 바로 적용하는 웹 접근성 가이드북 (0) | 2025.05.08 |
---|---|
마스터링 몽고DB 7.0(제4판) (0) | 2025.05.08 |
실리콘밸리에서 통하는 파이썬 인터뷰 가이드 (0) | 2025.05.08 |
7가지 프로젝트로 배우는 LLM AI 에이전트 개발 (0) | 2025.04.10 |
챗GPT, 글쓰기 코치가 되어 줘 (0) | 2025.04.07 |