이 책은 머신러닝 알고리즘의 이해를 돕기 위한 책이다. 이 책을 통해 머신러닝에 필요한 프로그래밍뿐만 아니라 관련 수학, 통계 개념을 완벽히 익히는 여행을 시작할 수 있을 것이다.
이 책의 특징
심층 신뢰 신경망과 같은 최근의 머신러닝 동향을 반영했다.
머신러닝을 이해하는 데 필요한 기본 확률과 통계 개념을 제공한다.
신경망을 사용한 지도학습에 대해 배운다.
차원 감축, EM 알고리즘, 최근접 이웃법, 최선 분류 경계, 커널 방법과 최적화를 다룬다.
진화학습, 강화학습, 트리 기반의 학습자 그리고 다양한 학습자들의 예측 값을 합치는 방법들을 다룬다.
자기조직화 특성 지도를 통해서 비지도학습의 중요성을 알아본다.
머신러닝에서의 최신 통계 기반 접근법들을 살펴본다.
2판에 추가된 사항
심층 신뢰 신경망과 가우시안 프로세스가 추가되었다.
더 자연스러운 흐름을 위해 각 장을 새롭게 재구성했다.
실습을 위한 실행 코드를 추가했으며, 서포트 벡터 머신 자료들을 보강했다.
랜덤 포레스트, 퍼셉트론 수렴 이론, 정확성 측정 방법을 위한 고려사항, 그리고 MLP를 위한 켤레 기울기 최적화에 대한 새로운 자료를 추가했다.
칼만 필터와 파티클 필터에 관한 설명이 추가되었다.
파이썬의 명명 규칙을 수정하고 코드를 개선했다.
책을 학습할 때 함께 제공되는 코드를 직접 실행해 볼 것을 추천한다. 각 장마다 더 읽을거리와 연습 문제를 통해 세부적인 예제를 제공하고 있으며, 예제에 사용된 모든 파이썬 코드는 저자의 웹페이지에서 내려받을 수 있다.
지은이 소개
스티븐 마슬랜드(Stephen Marsland)
스티븐 마슬랜드는 과학 컴퓨팅 분야의 교수이자 뉴질랜드 매시 대학교(Massey University)의 SEAT(School of Engineering and Advanced Technology) 대학원장으로 있다. 주요 관심사는 형태 공간, 오일러 방정식, 머신러닝 및 알고리즘이다. 영국 맨체스터 대학교(University of Manchester)에서 박사 학위를 받았다.
옮긴이 소개
강전형
미국 서던 캘리포니아 대학교(University of Southern California)의 컴퓨터공학 박사 과정에서 머신러닝을 전공하였다. Information Science Institute에서 다양한 인공지능 연구를 수행하였고, 현재는 구글 본사에서 근무 중이다. 추천 알고리즘부터 자연어 처리, 그리고 Best Paper Award를 받은 국제학회 논문을 포함해 30여 편의 논문을 머신러닝 관련 유명 저널에 발표했고, 실리콘밸리의 여러 회사에서 다양한 머신러닝 프로젝트를 수행했다.
문의하신 데이터셋은 저자의 사이트에서 다운로드 받으실 수 있습니다.
(링크: http://stephenmonika.net/ 에서 왼쪽 메뉴 중 Book 클릭한 다음, 해당 페이지에서 챕터별 리스트 아래 부분을 보면 Datasets가 보임)
각 장마다 원하는 데이터를 로드하기 위해서는 다운로드받은 다음 해당 폴더의 위치를 코드에서 적절히 수정하시기 바랍니다.
예: 3.4.4 절 코드의 경우
1. UCI Machine Learning Repository 데이터셋 홈페이지에 있는 윗부분의 검색창에 pima 검색 후 다운로드 (https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/)
2. 코드 수정
>>> os.chdir( ’[다운로드 폴더 입력]’) (우분투의 경우 pwd로 데이터셋 디렉토리 확인)
>>> pima = np.loadtxt( ’pima-indians-diabetes.data’, delimiter= ’,’)
소스코드에서 Dataset은 제공되지 않나요?
Dataset type도 제공되지 않고, 이러면 대부분의 코드가 아예 실행 조차 못하는데...
저자 홈페이지를 가도 찾지를 못하겠네요. 확인하여 각 ch. 별로 dataset를 제공 부탁드립니다.
빠른 시일 안에 확인하고 다시 댓글로 안내해 드리겠습니다. 감사합니다.
안녕하세요? 아래에 답변을 드립니다.
문의하신 데이터셋은 저자의 사이트에서 다운로드 받으실 수 있습니다.
(링크: http://stephenmonika.net/ 에서 왼쪽 메뉴 중 Book 클릭한 다음, 해당 페이지에서 챕터별 리스트 아래 부분을 보면 Datasets가 보임)
각 장마다 원하는 데이터를 로드하기 위해서는 다운로드받은 다음 해당 폴더의 위치를 코드에서 적절히 수정하시기 바랍니다.
예: 3.4.4 절 코드의 경우
1. UCI Machine Learning Repository 데이터셋 홈페이지에 있는 윗부분의 검색창에 pima 검색 후 다운로드 (https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/)
2. 코드 수정
>>> os.chdir( ’[다운로드 폴더 입력]’) (우분투의 경우 pwd로 데이터셋 디렉토리 확인)
>>> pima = np.loadtxt( ’pima-indians-diabetes.data’, delimiter= ’,’)
빠른 답변 정말 감사드립니다.
확인 해보겠습니다.
혹시 연습 문제에 대한 해답은 구할 수 없는 것인지요?
별도 강의에 대한 교재로 사용하고 있는 것이 아니라, 독학으로 학습하니, 맞는지를 확인할 길이 없네요.
네. 문제를 풀고 맞춰볼 방법이 없어서 많이 답답해하실 것 같습니다. 저희도 저작권사에게 요청을 했었지만, 제공할 자료가 없다고 하니 많이 아쉽습니다. ㅠㅠ