본문 바로가기

오탈자 정보

[러닝 스파크(개정판)]_오탈자

현재까지 발견된 이 책의 오탈자 정보와 오류를 안내합니다. 번역과 편집 시에 미처 확인하지 못하고 불편을 끼쳐드려 죄송하다는 말씀을 드립니다. 아래의 오탈자 사항은 추후 재쇄 시에 반영하도록 하겠습니다.

 

이외의 오탈자 정보를 발견하시면 옮긴이(eminency@naver.com)나 출판사(help@jpub.kr)로 연락주시면 고맙겠습니다. 

 

최종수정일자: 2023년 11월 16일 
1쇄본 오탈자

69쪽 '// 스칼라 예제' 2번째 에서(soulkeydev 님 제보)

.where(col("CallType")

.where(col("CallType").isNotNull)

 

83쪽 '그림 3-5 특정 쿼리 변환 예제'의 논리 계획 3번째 항목에서 순서 바꾸기(soulkeydev 님 제보)

users 테이블1                           events 파일

events 파일                               users 테이블1 

 

83쪽 '그림 3-5 특정 쿼리 변환 예제'의 물리 계획 2, 3번째 항목에서 연결 위치 바꾸기(users에 필터가 연결되는 것이 아니라 events에 필터가 연결되어 있어야 함)(LDesire 님 제보)

스캔(events)                         필터

                                                  ↑

                                                 스캔(users)  

필터                                         스캔(users)      

  ↑

스캔(events)  

 

148쪽에서(박정현 님 제보)

, transform(celsius, t -> ((t * 9) div 5) + 32)) AS fahrenheit

, transform(celsius, t -> ((t * 9) div 5) + 32) AS fahrenheit

 

150쪽 하단 'reduce()' 소절에서(이효림 님 제보)

reduce() 함수명을 모두 aggregate()로 바꿔야 합니다(모두 4번입니다).

 

∵ reduce는 SQL 함수로는 존재하지 않는 게 맞고, 대신 aggregate로 하면 잘 동작합니다. 아마 지은이가 함수 이름을 잘못 쓴 듯하다는 옮긴이의 확인입니다.

 

156쪽 1~2번째 줄에서(박정현 님 제보)

airports,
airports.IATA == foo.origin

airportsna,
airportsna.IATA == foo.origin

 

158쪽 본문 5~6 에서(LDesire 님 제보)

그러나 더 나은 접근 방식으로는 density_rank()와 같은 윈도우 함수를 사용하여 다음과 같이 계산할 수 있다.


그러나 더 나은 접근 방식으로는 dense_rank()와 같은 윈도우 함수를 사용하여 다음과 같이 계산할 수 있다.

 

177쪽 그림 6-2 위쪽 3개 항목 중에서 첫 번째 항에서(LDesire 님 제보)

• 스파크의 내부 텅스텐 이진 형식(그림 6-1 및 6-2 참고)은 자바 힙 메모리에서 객체를 저장하며, 크기가 작아 공간을 적게 차지한다.


• 스파크의 내부 텅스텐 이진 형식(그림 6-1 및 6-2 참고)은 자바 힙 메모리 밖에 객체를 저장하나, 데이터 사이즈가 작아 공간을 적게 차지한다.

 

191쪽 본문 1~2 에서(LDesire 님 제보)

기본적으로 셔플 파티션 개수는 spark.sql.shuffle.partitions에 50으로 지정되어 있다.


기본적으로 셔플 파티션 개수는 spark.sql.shuffle.partitions에 200으로 지정되어 있다.

221쪽 2단계: 데이터 변형의 파이썬, 스칼라 예제의 2행 lines.select() 함수에서 동일하게(LDesire 님 제보)

words = lines.select(split(col("value"), "\\s")


words = lines.select(explode(split(col("value"), "\\s"))

226쪽 종합적인 예제의 파이썬, 스칼라 예제의 lines.select() 함수에서 동일하게(LDesire 님 제보)

words = lines.select(split(col("value"), "\\s")


words = lines.select(explode(split(col("value"), "\\s"))

 

229쪽 데이터 프레임 트랜스포메이션의 파이썬, 스칼라 예제의 filteredLines.select() 함수에서 동일하게(LDesire 님 제보)

words = filteredLines.select(split(col("value"), "\\s")


words = filteredLines.select(explode(split(col("value"), "\\s"))