
복잡한 데이터 분석 흐름을 더 단순하게 만드는 DuckDB
최근 주목받고 있는 DuckDB를 활용해 SQL 기반 데이터 분석과 실전 프로젝트를 학습할 수 있도록 구성한 입문서다. 기본 사용법부터 SQL 기초와 고급 활용법, 파이썬 연동, 데이터 시각화와 대시보드 제작까지 단계적으로 학습하며 현대적인 데이터 분석 흐름을 자연스럽게 익힐 수 있다. 특히 프리미어리그(EPL) 경기 및 선수 데이터 분석, 유튜브 인기 영상 트렌드 분석, <케이팝 데몬 헌터스> 채널 분석 등 실제 데이터를 활용한 다양한 예제를 통해 데이터를 읽고 해석하는 과정을 직접 따라 해볼 수 있도록 구성했다. Plotly와 great_tables를 활용한 데이터 시각화와 대시보드 제작까지 함께 다루며, SQL과 데이터베이스를 처음 접하는 입문자부터 데이터 엔지니어까지 폭넓게 활용할 수 있도록 했다.
도서구매 사이트(가나다순)
| [교보문고] [도서11번가] [알라딘] [예스이십사] [쿠팡] |
출판사 제이펍
저작권사 제이펍
원서명 (없음)
도서명 LUVIT♥ EPL과 유튜브 데이터로 배우는 DuckDB
부제 SQL 분석부터 파이썬을 활용한 데이터 시각화, 대시보드 실습까지
지은이 이기준
옮긴이 (없음)
감수자 (없음)
시리즈 LUVIT
출판일 2026. 06. 25
페이지 440쪽
판 형 46배판변형(188*245*18.3)
제 본 무선(soft cover)
정 가 30,000원
ISBN 979-11-24205-71-6 93000
키워드 프리미어리그, 케이팝데몬헌터스, 케데헌, EDA, Plotly, Python, Polars, 폴라스, 데이터시각화, 대시보드, 데이터베이스, 데이터분석, 데이터엔지니어링
분 야 데이터 분석 / 파이썬 / SQL
관련 사이트
■ 저자 블로그
관련 시리즈
■ LUVIT(러빗) 시리즈
관련 포스트
■ 2026.06.15 - [출간 전 책 소식] - "그래서 DuckDB로 뭘 할 수 있는데?" 프리미어리그부터 케데헌까지 분석해봤습니다
관련 도서
■ Plotly로 시작하는 인터랙티브 데이터 시각화 in R & 파이썬
■ 실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R: 교육, 고용, 코로나 데이터를 활용한 시계열 프로젝트
시리즈 도서
■ LUVIT♥ 파이썬으로 만드는 초경량 한국어 LLM 챗봇
■ LUVIT♥ 실전 백엔드 러스트 Axum 프로그래밍
관련 파일 다운로드
■ https://github.com/estndard/luvit_DuckDB
강의 보조 자료(교재로 채택하신 분들은 https://jpub.tistory.com/notice/1076을 통해 다음 자료를 요청하실 수 있습니다.)
■ 본문의 그림과 표
미리보기(앞부속, 본문 일부)
정오표 페이지
■ (등록되는 대로 링크를 걸겠습니다.)
도서구매 사이트(가나다순)
| [교보문고] [도서11번가] [알라딘] [예스이십사] [쿠팡] |
도서 소개
데이터를 읽고 분석하는 가장 현대적인 방식 DuckDB
이 책은 실제 데이터를 다루는 분석 과정 속에서 DuckDB의 강점을 자연스럽게 경험할 수 있도록 구성했습니다. 프리미어리그(EPL) 경기 및 선수 데이터를 활용해 순위와 경기 결과를 분석하고, 유튜브 인기 영상과 <케이팝 데몬 헌터스> 채널 데이터를 통해 트렌드 흐름을 살펴봅니다. 데이터를 불러오고, SQL로 분석하고, 파이썬으로 시각화하고, 대시보드로 연결하는 흐름을 따라가며 DuckDB 기반 데이터 분석 환경을 단계적으로 익힐 수 있습니다.
이 책만의 특별한 점
DuckDB는 강력하지만 데이터베이스와 SQL이 낯선 독자에게는 어렵게 느껴질 수 있습니다. 이 책은 그런 부담을 줄이는 데서 출발합니다. 데이터를 불러오고, SQL로 분석하고, 시각화하는 흐름을 따라가다 보면 DuckDB의 사용 방식과 장점이 자연스럽게 익숙해지도록 구성했습니다. 설명을 먼저 외우기보다 직접 쿼리를 실행하고 결과를 확인하면서 '이렇게 분석하는구나'를 체감하는 데 초점을 맞췄습니다. EPL 경기 데이터와 유튜브 데이터를 활용한 실전 예제를 따라가며 SQL과 데이터 분석 흐름을 자연스럽게 익힐 수 있습니다.
DuckDB는 별도의 무거운 서버 환경 없이도 가볍게 설치해 사용할 수 있는 분석 데이터베이스입니다. 이 책은 CSV와 Parquet 같은 다양한 데이터를 직접 다루며 DuckDB의 빠르고 직관적인 분석 흐름을 자연스럽게 익힐 수 있도록 구성했습니다.
단순한 문법 예제가 아니라 프리미어리그(EPL) 경기 데이터와 유튜브 데이터를 활용해 실제 분석 흐름을 경험합니다. 데이터를 조회하고, 조인하고, 집계하고, 시각화하는 과정을 따라가며 데이터 분석의 흐름을 자연스럽게 이해할 수 있습니다.
조회와 조인 같은 기본 SQL부터 CTE, 윈도 함수, 피벗 등 분석에 자주 사용되는 고급 SQL까지 단계적으로 학습합니다. SQL과 데이터베이스를 처음 접하는 독자도 흐름을 따라가며 학습할 수 있도록 구성했습니다.
DuckDB를 파이썬과 연동해 데이터를 분석하고, Plotly와 great_tables를 활용해 시각화와 대시보드 제작까지 경험합니다. 단순히 쿼리만 작성하는 것이 아니라 실제 데이터 분석 결과를 어떻게 보여줄 것인지까지 함께 다룹니다.
이 책은 누가 읽으면 좋을까요?
- 데이터베이스를 사용한 데이터 분석에 처음 입문하는 분
- 기초 SQL부터 분석용 고급 SQL까지 실전 예제로 익히고 싶은 분
- EPL 및 유튜브 데이터를 활용해 실제 분석 흐름을 경험하고 싶은 분
이 책에서 다루는 내용은 무엇인가요?
- DuckDB 개념과 사용법
- DuckDB CLI와 SQL 기반 데이터 처리
- CSV, JSON, Parquet 데이터 활용
- 윈도 함수, 피봇 등 데이터 분석용 SQL
- 파이썬과 DuckDB 연동 데이터 분석
- Plotly와 great_tables 기반 데이터 시각화
- 실전 프로젝트: 프리미어리그 데이터와 유튜브 트렌드 분석
지은이 소개
이기준
한국항공대학교에서 컴퓨터공학으로 박사 학위를 받았다. 한국교육개발원(KEDI)에서 국가교육통계 데이터의 디지털화를 시작으로 20여 년간 국가교육통계 데이터 조사, 관리, 분석과 서비스 시스템의 기획, 개발, 운영, 관리의 전 분야를 실무부터 총괄까지 수행했다. KEDI에서 교육통계센터소장 및 국가교육통계연구본부장 등을 역임했고, 미국 보이시 주립대학교 교육공학과에서 연수했다. 한국항공대학교, 극동대학교 등에서 강의하고, 학생 수, 유아 수 등의 교육 데이터 예측 업무를 수행했다. 저서로 2022년 세종도서 학술부문 우수도서에 선정된 《실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R》(제이펍, 2021), 《Plotly로 시작하는 인터랙티브 데이터 시각화 in R & 파이썬》(제이펍, 2023), 《LUVIT♥ 폴라스로 시작하는 데이터 분석》(제이펍, 2026)이 있고, 공저로 《메타 버스 유니버시티》(동문사, 2023)가 있다.
차례
머리말 viii
베타리더 후기 xi
이 책을 읽는 법 xiv
학습 가이드 xviii
로드맵 xx
PART 1 분석 데이터베이스의 떠오르는 샛별, DuckDB
CHAPTER 1 DuckDB란?
1.1 DuckDB의 개발 배경과 인기 4
1.2 DuckDB의 장점 9
1.3 DuckDB의 내부 구조 12
1.4 DuckDB의 중요성 18
돌아보기/쪽지시험 23
CHAPTER 2 DuckDB 들어가기
2.1 설치 및 접속과 종료 25
2.2 EPL 데이터베이스를 만들기 위한 준비 34
2.3 스키마로 보는 EPL 데이터베이스 목록 40
2.4 EPL 데이터베이스를 다루는 기능 45
돌아보기/쪽지시험 51
CHAPTER 3 DuckDB CLI로 EPL 데이터 살펴보기
3.1 DuckDB CLI 기초 53
3.2 EPL 데이터베이스 조회 60
3.3 데이터 임포트 71
3.4 데이터베이스 통합 89
3.5 데이터 내보내기 94
돌아보기/쪽지시험 100
PART 2 분석을 위한 SQL
CHAPTER 4 DuckDB SQL로 EPL 데이터 조작하기
4.1 DuckDB SQL IDE로 시작하는 ESPN 데이터베이스 104
4.2 DML로 다루는 선수, 팀, 경기 데이터 조회 110
4.3 DDL로 구성하는 EPL, 팀, 선수 테이블과 뷰 133
4.4 조인 연산으로 다루는 EPL 경기, 선수, 팀 데이터 142
4.5 집합 연산으로 다루는 유로파리그/EPL 선수 라인업 153
돌아보기/쪽지시험 159
CHAPTER 5 고급 SQL로 EPL 데이터 분석하기
5.1 날짜와 시간 함수로 분석하는 EPL 경기 결과 161
5.2 서브 쿼리로 분석하는 EPL 순위와 득점 170
5.3 CTE로 구조화하는 EPL 득점, 순위 분석 178
5.4 CASE로 구분하는 EPL 경기 결과와 수익 186
5.5 GROUP BY 확장으로 요약하는 EPL 공격 지표 193
5.6 윈도 함수로 계산하는 EPL 득점, 순위, 누적 기록 198
5.7 피벗으로 변환하는 EPL 팀 로스터 표 215
5.8 고급 SQL로 분류하고 실행하는 EPL 데이터 220
돌아보기/쪽지시험 225
CHAPTER 6 DuckDB 전용 SQL로 EPL 데이터 활용하기
6.1 DuckDB용 데이터 타입 227
6.2 DuckDB용 SQL 문법 232
6.3 DuckDB용 질의 기능 242
돌아보기/쪽지시험 249
PART 3 실전 DuckDB 프로젝트
CHAPTER 7 파이썬으로 DuckDB를 연동하여 EPL 데이터를 분석하고 시각화하기
7.1 파이썬에서의 DuckDB 환경 구성 254
7.2 파이썬에서 DuckDB 쿼리로 다루는 EPL 순위, 경기, 선수 데이터 260
7.3 Plotly와 great_tables로 시각화하는 EPL 선수와 팀 성과 275
돌아보기/쪽지시험 312
CHAPTER 8 DuckDB를 사용한 EPL 대시보드 만들기
8.1 대시보드란? 314
8.2 EPL 데이터 분석 대시보드 만들기 319
돌아보기/쪽지시험 333
CHAPTER 9 DuckDB로 유튜브 인기 영상 분석하기
9.1 유튜브 데이터셋 다운로드 및 불러오기 335
9.2 유튜브 데이터 검토 340
9.3 유튜브 데이터 파생 변수 생성 346
9.4 유튜브 데이터 탐색적 분석 355
9.5 주제별 유튜브 트렌드 분석 377
9.6 <케이팝 데몬 헌터스> 유튜브 트렌드 분석 391
돌아보기/쪽지시험 411
용어집 413
찾아보기 416
제이펍 소식 더 보기(제이펍의 소통 채널에서 더욱 다양한 소식을 확인하세요!)
| 블로그 유튜브 인스타그램 트위터 페이스북 |
'도서 소개' 카테고리의 다른 글
| 디자인, 이렇게 하면 되나요?(최신 개정판) (0) | 2026.06.19 |
|---|---|
| AI 에이전트 개발과 운영 올인원 가이드 (0) | 2026.06.10 |
| 진짜 쓰는 프리미어 영상 편집 2026(최신 개정판) (0) | 2026.06.10 |
| AI가 일하는 법 (0) | 2026.05.27 |
| AI를 이기는 개발자 커리어 관리 가이드 (0) | 2026.05.22 |