현재까지 발견된 이 책의 오탈자 정보와 오류를 안내합니다. 번역과 편집 시에 미처 확인하지 못하고 불편을 끼쳐드려 죄송하다는 말씀을 드립니다. 아래의 오탈자 사항은 추후 재쇄 시에 반영하도록 하겠습니다.
이외의 오탈자 정보를 발견하시면 옮긴이(eminency@naver.com)나 출판사(help@jpub.kr)로 연락주시면 고맙겠습니다.
최종수정일자: 2023년 11월 16일 1쇄본 오탈자 |
69쪽 '// 스칼라 예제' 2번째 줄에서(soulkeydev 님 제보)
.where(col("CallType")
⇒
.where(col("CallType").isNotNull)
83쪽 '그림 3-5 특정 쿼리 변환 예제'의 논리 계획 3번째 항목에서 순서 바꾸기(soulkeydev 님 제보)
users 테이블1 events 파일
⇒
events 파일 users 테이블1
83쪽 '그림 3-5 특정 쿼리 변환 예제'의 물리 계획 2, 3번째 항목에서 연결 위치 바꾸기(users에 필터가 연결되는 것이 아니라 events에 필터가 연결되어 있어야 함)(LDesire 님 제보)
스캔(events) 필터
↑
스캔(users)
⇒
필터 스캔(users)
↑
스캔(events)
148쪽 끝줄에서(박정현 님 제보)
, transform(celsius, t -> ((t * 9) div 5) + 32)) AS fahrenheit
⇒
, transform(celsius, t -> ((t * 9) div 5) + 32) AS fahrenheit
150쪽 하단 'reduce()' 소절에서(이효림 님 제보)
reduce() 함수명을 모두 aggregate()로 바꿔야 합니다(모두 4번입니다).
∵ reduce는 SQL 함수로는 존재하지 않는 게 맞고, 대신 aggregate로 하면 잘 동작합니다. 아마 지은이가 함수 이름을 잘못 쓴 듯하다는 옮긴이의 확인입니다.
156쪽 1~2번째 줄에서(박정현 님 제보)
airports,
airports.IATA == foo.origin
⇒
airportsna,
airportsna.IATA == foo.origin
158쪽 본문 5~6번째 줄에서(LDesire 님 제보)
그러나 더 나은 접근 방식으로는 density_rank()와 같은 윈도우 함수를 사용하여 다음과 같이 계산할 수 있다.
⇒
그러나 더 나은 접근 방식으로는 dense_rank()와 같은 윈도우 함수를 사용하여 다음과 같이 계산할 수 있다.
177쪽 그림 6-2 위쪽 3개 항목 중에서 첫 번째 항에서(LDesire 님 제보)
• 스파크의 내부 텅스텐 이진 형식(그림 6-1 및 6-2 참고)은 자바 힙 메모리에서 객체를 저장하며, 크기가 작아 공간을 적게 차지한다.
⇒
• 스파크의 내부 텅스텐 이진 형식(그림 6-1 및 6-2 참고)은 자바 힙 메모리 밖에 객체를 저장하나, 데이터 사이즈가 작아 공간을 적게 차지한다.
191쪽 본문 1~2번째 줄에서(LDesire 님 제보)
기본적으로 셔플 파티션 개수는 spark.sql.shuffle.partitions에 50으로 지정되어 있다.
⇒
기본적으로 셔플 파티션 개수는 spark.sql.shuffle.partitions에 200으로 지정되어 있다.
221쪽 2단계: 데이터 변형의 파이썬, 스칼라 예제의 2행 lines.select() 함수에서 동일하게(LDesire 님 제보)
words = lines.select(split(col("value"), "\\s")
⇒
words = lines.select(explode(split(col("value"), "\\s"))
226쪽 종합적인 예제의 파이썬, 스칼라 예제의 lines.select() 함수에서 동일하게(LDesire 님 제보)
words = lines.select(split(col("value"), "\\s")
⇒
words = lines.select(explode(split(col("value"), "\\s"))
229쪽 데이터 프레임 트랜스포메이션의 파이썬, 스칼라 예제의 filteredLines.select() 함수에서 동일하게(LDesire 님 제보)
words = filteredLines.select(split(col("value"), "\\s")
⇒
words = filteredLines.select(explode(split(col("value"), "\\s"))
'오탈자 정보' 카테고리의 다른 글
[디자인 패턴의 아름다움]_오탈자 (0) | 2023.07.27 |
---|---|
[자동화 실무 사례로 배우는 구글 앱스 스크립트]_오탈자 (0) | 2023.07.11 |
[카프카 핵심 가이드(개정증보판)]_오탈자 (0) | 2023.05.09 |
[Apache Airflow 기반의 데이터 파이프라인]_오탈자 (0) | 2023.04.19 |
[삐뽀삐뽀 보안 119]_오탈자 (0) | 2023.04.13 |