본문 바로가기

도서 소개

머신러닝 인 액션: 기계 학습 알고리즘으로 데이터 마이닝하기

 

 

그동안 읽어주신 분들께 감사드립니다. 이 책은 현재 절판되었습니다.
머신러닝을 배우기에 가장 훌륭한 책! ★★★★★ _아마존 독자서평 중에서
머신러닝을 위한 파인썬 입문서로도 괜찮은 책! ★★★★★ _아마존 독자서평 중에서
인공지능 전문가가 번역, 원서의 소스 오류까지 모두 수정한 본격 머신러닝 학습서!

출판사 제이펍
원출판사 MANNING
원서명 Machine Learning IN ACTION(원서 ISBN: 9781617290183)
저자명 피터 해링턴(Peter Harrington)
역자명 김영진
출판일 2013년 6월 26일
페이지 480쪽
판  형 46배판 변형(188*245), 반양장(soft cover)
정  가 30,000원
ISBN 978-89-94506-66-1 (93000)
키워드 빅 데이터 / 파이썬 / 기계 학습 / 데이터 마이닝 / 알고리즘
분야 기계 학습 / 인공 지능 / 데이터 마이닝

관련 사이트
원출판사 도서소개 페이지
아마존 도서소개 페이지
역자 Q&A 메일

관련 포스트
2013/06/17 - [출간전 책소식] - 빅 데이터 시대에 주목받는 기술, 기계 학습!

관련 시리즈
■ (없음)

 

소스 코드 다운로드
http://www.manning.com/pharrington/MLiA_SourceCode.zip

■ (원서 소스 코드 오류 수정 및 한글 주석의 소스 코드는 정리되는 대로 다시 올려드리겠습니다)

강의 자료
■ 교재로 채택하신 분들에게는 강의교안을 제작할 수 있는 자료를 보내드리도록 하겠습니다(출판사로 메일이나 전화로 연락주세요).

관련 도서
세븐 데이터베이스: 만들면서 파악하는 NoSQL

몽고디비 인 액션: 빅 데이터 시대의 초고의 NoSQL 데이터베이스

샘플 PDF(머리말, 차례 등의 앞부속물, 1장 기계 학습 기초, 2장 k-최근접 이웃 알고리즘)(찾아보기)

머신러닝인액션_sample.pdf
다운로드
머신러닝인액션_index.pdf
다운로드


정오표 페이지
■ http://jpub.tistory.com/332


도서구매 사이트(가나다순)

[강컴]   [교보문고]   [도서11번가]   [반디앤루니스]   [알라딘]   [예스이십사]   [인터파크]


도서 소개

빅 데이터 분석의 핵심 기술, 기계 학습!

《머신러닝 인 액션》은 개발자를 위해 작성된 지침서다. 통계자료 처리, 데이터 분석, 데이터 시각화 등을 독자들의 업무에 바로 적용할 수 있도록 알고리즘 주요 부분을 재사용 가능한 코드로 사용하였다. 독특하고 다양한 파이썬 예제를 통해 분류, 예측, 추천 그리고 고차원 속성을 요약하고 간소화하는 개념과 방법을 이해하게 될 것이다.

최고의 한 수를 위한 데이터 마이닝!
컴퓨터는 자신의 성능을 개선하기 위해 경험적 지식을 활용한다. 이러한 학습을 위해서는 데이터를 얻는 프로그램이 있어야 하며, 그 데이터의 흥미롭고 유용한 패턴을 찾을 수 있도록 알고리즘이 있어야 한다. 하지만 가장 먼저 필요한 것은 분석을 하고자 하는 영역을 설정하는 것이며, 이를 분석하기 위한 수학자들이 있어야 한다는 것이다. 기계 학습은 이처럼 다양한 기술들을 필요로 한다.

독자들은 기계 학습이나 통계 처리에 대한 사전 지식이 없어도 상관없다. 파이썬이 기계 학습과 친숙해지도록 도와줄 것이다.


이 책의 주요 내용은 다음과 같다.
• 기계 학습 소개

• 다양한 예제로 기계 학습 실습하기
• 매일 발생되는 데이터 분석하기
• 어프라이어리와 에이다부스트 같은 전형적인 알고리즘 수행하기


8개의 기계 학습 알고리즘

• C4.5(trees)
• k-평균(k-means)
• 지지 벡터 머신기계(support vector machines)
• 어프라이어리(Apriori)
• 에이다부스트(AdaBoost)
• k-최근접 이웃(k-Nearest Neighbors)
• 나이브 베이스(Naïve Bayes)
• 카트(CART)

추천사
이해하기 쉽고 유용한 책!
_알렉산드라 알베스(Alexandre Alves), 오라클(Oracle Corpration)

핵심 개념의 똑똑하고 매력적인 응용 프로그램!
_패트릭 투히(Patrick Toohey), 메틀러토레도(Mettler-Toledo Hi-Speed)

기막힌 예제들! 이를 통해 무엇이든 ‘학습’할 수 있다.
_존 그리핀(John Griffin), 《Hibernate Search in Action》의 공동 저자

다양한 기계학습 알고리즘으로 능숙하게 설계된 ‘쉬운’ 분류!
_스티븐 맥카메이(Stephen McKamey), 아이소머 이노베이션(Isomer Innovations)

현업에 종사하는 전문가를 위한 훌륭한 책!
_에드몽 베골리(edmon begoli), 아마존 ★★★★★

저자 소개
피터 해링턴(Peter Harrington)

피터 해링턴은 전기 공학 분야의 학사 및 석사 학위를 가지고 있다. 캘리포니아와 중국에 있는 인텔 기업에서 7년간 일했으며, 다섯 개의 미국 특허를 보유하고 있다. 그의 논문은 세 개의 학술 저널에 게재되었고, 현재 질라바이트 주식회사(Zillabyte Inc.)의 수석 과학자이다. 질라바이트에 합류하기 전 2년간 기계 학습 소프트웨어 상담가로 일했었다. 현재는 프로그램 대회에 참가하기도 하고 3D 프린터를 만들기도 하면서 자유 시간을 보내고 있다.

역자 소개
김영진

로봇을 좋아하던 10살 소년의 막연한 꿈은 어느덧 열망이 되어 인공지능 분야에 입문하게 되었다. 단순한 작업을 위해 만들어진 기계가 아닌, 사람처럼 느끼고 생각하는 로봇을 만들겠다는 꿈을 이루기 위해서는 해야 할 연구의 크기가 만만치 않음을 실감하며 잠시 잠깐 후회한 적도 있으나, 꿋꿋이 꿈을 향해 가던 중 귀한 인연이 닿아 첫 번역서인 《머신러닝 인 액션》의 작업에 동참하게 되었다. 현재 숭실대학교 인공지능 연구실 BI팀 소속으로 배움을 쌓아가고 있다.

차례
제1부 분류
1장 기계 학습 기초

1.1 기계 학습이란 무엇인가?  5
1.2 주요 전문용어  8
1.3 기계 학습의 주요 기술  11
1.4 올바른 알고리즘 선정 방법  12
1.5 기계 학습 응용 프로그램 개발 단계  14
1.6 왜 파이썬인가?  16
1.7 NumPy 라이브러리로 시작하기  19
1.8 요약  21

더보기
2장 k-최근접 이웃 알고리즘
2.1 거리 측정을 이용하여 분류하기  24
2.2 예제: kNN을 이용하여 데이트 사이트의 만남 주선 개선하기  31
2.3 예제: 필기체 인식 시스템  42
2.4 요약  46

3장 의사결정 트리: 한 번에 하나의 속성으로 데이터 집합 분할하기
3.1 트리 구조  50

3.2 매스플롯라이브러리 주석으로 파이썬에서 트리 플롯하기  63
3.3 분류기 검사와 저장  72
3.4 예제: 콘택트렌즈 유형 예측하기  74
3.5 요약  77

4장 나이브 베이스: 확률 이론으로 분류하기
4.1 베이지안 의사결정 이론으로 분류하기  79
4.2 조건부 확률  81
4.3 조건부 확률로 분류하기  82
4.4 나이브 베이스로 문서 분류하기  83
4.5 파이썬으로 텍스트 분류하기  85
4.6 예제: 스팸 이메일 분류하기  95
4.7 예제: 나이브 베이스를 사용하여 개인 광고에 포함된 지역 특색 도출하기  99
4.8 요약  105

5장 로지스틱 회귀
5.1 로지스틱 회귀와 시그모이드 함수로 분류하기: 다루기 쉬운 계단 함수  108
5.2 가장 좋은 회귀 계수를 찾기 위해 최적화 사용하기  110
5.3 예제: 말의 배앓이 치사율 평가하기  122
5.4 요약  127

6장 지지 벡터 머신
6.1 최대 마진으로 데이터 분리하기  129
6.2 최대 마진 찾기  131
6.3 SMO 알고리즘으로 효율적인 최적화하기  134
6.4 전체 플랫 SMO를 이용해 최적화 속도 올리기  143
6.5 더 복잡한 데이터를 위해 커널 사용하기  151
6.6 예제: 필기체 인식 예제 다시 적용하기  159
6.7 요약  162

7장 에이다부스트 메타 알고리즘으로 분류 개선하기
7.1 데이터 집합의 다양한 표본을 사용하는 분류기  165
7.2 훈련: 오류에 초점을 맞춘 분류기 개선  167
7.3 의사결정 스텀프로 약한 학습기 생성하기  169
7.4 전체 에이다부스트 알고리즘 구현하기  173
7.5 검사: 에이다부스트로 분류하기  177
7.6 예제: 에이다부스트에 복잡한 데이터 집합 적용하기  179
7.7 분류 불균형  182
7.8 요약  189

제2부 회귀로 수치형 값 예측하기
8장 회귀: 수치형 값 예측하기

8.1 회귀로 최적선 찾기  194
8.2 지역적 가중치가 부여된 선형 회귀  201
8.3 예제: 전복 나이 예측하기  205
8.4 데이터를 이해하기 위한 축소 계수  207
8.5 성향 / 변화량 관계  215
8.6 예제: 레고 가격 예측하기  217
8.7 요약  225

9장 트리 기반 회귀
9.1 지역적으로 복잡한 데이터 모델링하기  227
9.2 연속적이고 이산적인 속성으로 트리 구축하기  228
9.3 회귀를 위해 CART 사용하기  232
9.4 트리 가지치기  238
9.5 모델 트리  243
9.6 예제: 일반 회귀와 트리 방법 비교  246
9.7 파이썬에서 GUI를 생성하기 위해 Tkinter 사용하기  250
9.8 요약  257

제3부 비지도 학습
10장 k–평균 군집화: 항목 표시가 없는 아이템 그룹 짓기
10.1 k–평균 군집화 알고리즘  262

10.2 후처리로 군집 성능 개선하기  268
10.3 양분하는 k–평균  270
10.4 예제: 지도상의 지역점 군집화  274
10.5 요약  281

11장 어프라이어리 알고리즘으로 연관 분석하기
11.1 연관 분석  284
11.2 어프라이어리 이론  286
11.3 어프라이어리 알고리즘으로 빈발 아이템 집합 찾기  288
11.4 빈발 아이템 집합으로 연관 규칙 마이닝하기  296
11.5 예제: 국회 투표 패턴 알아보기  301
11.6 예제: 독버섯과 유사한 속성 찾기  312
11.7 요약  314

12장 FP-성장 알고리즘으로 빈발 아이템 집합 찾기
12.1 FP-트리: 데이터 집합을 부호화하는 효과적인 방법  316
12.2 FP-트리 구축하기  318
12.3 FP-트리로 빈발 아이템 집합 마이닝하기  325
12.4 예제: 트위터 피드에서 함께 발생하는 단어 찾기  331
12.5 예제: 뉴스 사이트에서 클릭 스트림 마이닝하기  336
12.6 요약  337

제4부 부가적인 도구들
13장 데이터 간소화를 위한 주요 구성요소 분석 사용하기

13.1 차원 축소 기술  342
13.2 주요 구성요소 분석  343
13.3 예제: PCA로 반도체 제조 데이터 차원 축소하기  348
13.4 요약  352

14장 특이 값 분해로 데이터 간소화하기
14.1 SVD 응용 프로그램  355
14.2 행렬 인수분해  358
14.3 파이썬 SVD  359
14.4 협력적 여과 기반 추천 엔진  362
14.5 예제: 레스토랑 메뉴 추천 엔진 구축하기  367
14.6 예제: SVD로 이미지 압축하기  375
14.7 요약  378

15장 빅 데이터와 맵 리듀스
15.1 맵 리듀스: 분산 컴퓨팅의 기본 구조  381

15.2 하둡 스트리밍  384
15.3 아마존 웹 서비스로 하둡 작업 실행하기  388
15.4 맵 리듀스에서의 기계 학습  395
15.5 파이썬에서 mrjob을 사용한 맵 리듀스 자동화  397
15.6 예제: SVM 분산처리를 위한 페가소스 알고리즘  402
15.7 맵 리듀스, 정말로 필요한가?  410
15.8 요약  410

부록 A 파이썬 시작하기
A.1 파이썬 설치  412
A.2 파이썬에 대한 간단한 소개  414
A.3 NumPy에 대한 간단한 소개  418
A.4 뷰티플 수프  423
A.5 Mrjob  423
A.6 스마트 투표  424
A.7 파이썬 트위터  425

부록 B 선형대수학
B.1 행렬  427

B.2 역행렬  430
B.3 표준  432
B.4 미분행렬  432

부록 C 확률 다시 보기
C.1 확률  434
C.2 결합 확률  435
C.3 확률의 기본 규칙  436

부록 D 리소스

찾아보기