본문 바로가기

오탈자 정보

[따라하며 배우는 데이터 과학]_오탈자

현재까지 발견된 위 책의 오탈자 정보와 오류, 그리고 보다 매끄러운 문장을 위해 수정한 내용을 안내해드립니다. 집필과 편집 시에 미처 확인하지 못하고 불편을 끼쳐드려 죄송하다는 말씀을 드립니다. 아래의 오탈자 사항은 추후 재쇄 시에 반영하도록 하겠습니다. 


이외의 오탈자 정보를 발견하시면 지은이 블로그(https://dataninja.me/ipds-kr/)나 출판사(readers.jpub@gmail.com)로 연락주시면 고맙겠습니다.


저자께서 운영하는 errata 페이지도 함께 참고하시기 바랍니다.



최종수정일자: 2018년 12월 24일

2쇄본 오탈자


61쪽 연습문제 4번에서(이*희 님 제보)

다운로드하도록 하자(https://goo.gl/R08lpm, 무료 캐글 계정이 필요하다).

==>

다운로드하도록 하자(https://www.kaggle.com/carolzhangdc/imdb-5000, 무료 캐글 계정이 필요하다).


150쪽 상단 수식에서 X가 누락됨(장*민 님 제보)

==>


183쪽 8.3.3절 2행에서(김*규 님 제보)

13개의 설명변수가 있으므로 p = 13일까?

==>

14개의 설명변수가 있으므로 p = 13일까?


180쪽 첫 번째 문단 3행에서(김*규 님 제보)

13개의 설명변수에 근거해서

==>

14개의 설명변수에 근거해서


71쪽 아래 코드 박스에서(양*화 님 제보)

df<- data.frame((gp = factor(rep(letters[1:3], each = 10)), y = rnorm(30)))

==>

df <- data.frame(gp = factor(rep(letters[1:3], each = 10)), y = rnorm(30))


146쪽 하단에서 5번째 줄에서(양*화 님 제보)

표준편차는 0.027 ==> 표준오차는 0.027


157쪽 두 번째 문단 4-5행에서(양*화 님 제보)

쉽게 픽업(classpickup)과 (classsuv)가 

==>

쉽게 픽업(classpickup)과 SUV(classsuv)


157쪽 세 번째 문단 3행에서(양*화 님 제보)

−7.92+−1.96∗1.62

==>

−7.92±1.96∗1.62


185쪽 두 번째 코드 박스의 6행에서(양*화 님 제보)

validate_idx = sample(idx, n * .20)

==>

validate_idx <- sample(idx, n * .20)



최종수정일자: 2017년 10월 10일

1쇄본 오탈자


30쪽 그림 2-7(조*근 님 제보)

==>


36쪽 아래에서 5행(조*근 님 제보)

웹 주소는 https://archive.ics.uci.edu/ml/datasets/Housing이다. 

==>

웹 주소는 https://archive.ics.uci.edu/ml/machine-learning-databases/housing/이다.


56쪽 7행과 8행(조*근 님 제보)

을 랜덤 샘플링한다. 

==>

을 랜덤 샘플링한다.


111쪽 3행(조*근 님 제보)

두 번째 분포 표본표준편차의 분산이다. 

==>

두 번째 그림은 표본표준편차의 분포이다.


111쪽 5행(조*근 님 제보)

(이론적으로는 카이제곱 분포를 따른다는 것을 수리통계를 배우면 알 수 있다).

==>

(참고로, 이론적으로는 표본표준편차의 제곱인 표본분산  s^2의 함수  (n-1)*s^2/\sigma^2는 카이제곱분포 \chi^2(n-1)를 따른다. 여기서 n=10은 표본 크기, \sigma^2 = 1.789^2은 참분산 값이다. https://en.wikipedia.org/wiki/Variance#Distribution_of_the_sample_variance를 참조하라).


116쪽 6.7.2절 1행(조*근 님 제보)

예를 들어, 위의 수면제 사람들에게 P-값의 의미를 질문하면 

==>

예를 들어, 위의 수면제 데이터 분석 결과 대해 사람들에게 P-값의 의미를 질문하면


126쪽 1행(조*근 님 제보)

95% 신뢰구간의 크기는 1/sqrt(n)이다.

95% 신뢰구간의 크기는 1/sqrt(n)에 비례한다.


145쪽 회귀모형 식에서(조*근 님 제보)

Y_i \sim \beta_0 + \beta_1 x_{1i} + … + \beta_p x_{pi} + \epsilon_i, \epsilon_i \sim iid N(0, \sigma^2)

==>(첨자의 순서가 바뀌었습니다)

Y_i \sim \beta_0 + \beta_1 x_{i1} + … + \beta_p x_{ip} + \epsilon_i, \epsilon_i \sim iid N(0, \sigma^2) 



145쪽 하단 두 회귀식에서(조*근 님 제보) 

오차항 엡실론의 모양이 서로 다릅니다. 의미는 동일합니다. 둘 다 $\epsilon$입니다.


146쪽 4행(조*근 님 제보) 

표준편차(Standard Error)

==>

표준오차(Standard Error)


146쪽 5행(조*근 님 제보

P-값(Pr(> |t|))

==>

P-값(Pr(T > |t|))


113페이지 6.6절 첫 번째 문단 2행에서(김*석 님 제보)

다양한 가설검정 상황에서 비전문들을 이해하기 쉽게

==>

다양한 가설검정 상황에서 비전문가들이 이해하기 쉽게"


126페이지 하단 수식의 첫 번째 행에서 (김*석 님 제보)

두 개의 t*z*로 수정해야 합니다. 


140페이지 마지막 문단 2행에서(김*석 님 제보)

가장 오차한계가 큰 경우인 p-hat이 

==>

가장 오차한계가 큰 경우인 p^


157페이지 첫 번째 수식에서(김*석 님 제보)

yhat = 24.8 + 3.50

==>

y^ = 24.8 + 3.50


212페이지 하단 코드 박스 밑에서 2행에서(김*석 님 제보)
Performance(pred_tr,

==>

performance(pred_rf,