본문 바로가기

도서 소개

실전에서 바로 쓰는 시계열 데이터 처리와 분석 in R: 교육, 고용, 코로나 데이터를 활용한 시계열 프로젝트

2022 세종도서 우수학술도서 선정

복잡한 수학 공식 없이 코드 위주의 설명과 실제 데이터를 통해 배우는 시계열 데이터와 알고리즘!

 

도서구매 사이트(가나다순)

[교보문고] [도서11번가] [알라딘] [예스이십사] [인터파크] [쿠팡]


전자책 구매 사이트
(가나다순)

[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사]

 

출판사 제이펍
지은이 이기준
출판일 2021년 7월 20일
페이지 284쪽
판 형 46배판변형(188 x 245 x 16)
제 본 무선(soft cover)
정 가 24,000원
ISBN 979-11-91600-15-5 (93000)
키워드 신경망, 통계, 예측, 지수 평활화, ARIMA, fable, modeltime, prophet, TBATs
분 야 R / 데이터 분석

 

관련 사이트

저자 운영 블로그

팟빵 '데이터홀릭'에서의 책소개 팟캐스트


관련 포스트

2021/7/7 - 시계열 데이터, 여러분은 얼마나 알고 있나요?

 

관련 도서

R을 이용한 퀀트 투자 포트폴리오 만들기(개정판)

앤디 필드의 유쾌한 R 통계학

관련 파일 다운로드

예제 코드 다운로드

주시기 바랍니다. 확인 후 연락을 드리도록 하겠습니다.

강의보조 자료

(교재로 채택하신 분들은 메일[textbook@jpub.kr]을 보내주시면 다음의 자료를 보내드리겠습니다.)

■ 본문의 그림과 표

■ 샘플 PDF(표지, 차례, 저자 머리말, 추천사, 베타리더 후기, 1장 '시계열 데이터', 3장 '시계열 시각화' 일부, 6장 '시계열 forecasting Part II - 시계열 예측 모델' 일부)

 

 

실전에서바로쓰는시계열데이터처리와분석inR_sample.pdf
2.16MB

 

정오표 페이지

https://jpub.tistory.com/1186?category=209690

도서구매 사이트(가나다순)

[교보문고] [도서11번가] [알라딘] [예스이십사] [인터파크] [쿠팡]


전자책 구매 사이트
(가나다순)

[교보문고] [구글북스] [리디북스] [알라딘] [예스이십사]


도서 소개

복잡한 수학 공식 없이 코드 위주의 설명과 실제 데이터를 통해 배우는 시계열 데이터와 알고리즘!


이 책의 특징 및 구성
우리 주변에서 쉽게 얻을 수 있는 실제 데이터를 사용한다.
우리나라의 최신 데이터를 이용하여 시계열 분석을 직접 수행하면서 분석 방법을 익힌다.
연별, 월별, 일별 데이터로 실습 데이터를 세분화하여 실무에 바로 적용할 수 있다.
복잡한 수식을 사용하지 않는 대신, 쉬운 개념 설명과 함께 R로 구현하며 이해한다.
시계열 분석 워크플로인 문제 파악 → 데이터 생성 → 리포팅을 위한 데이터 시각화와 데이터 핸들링 → 시계열 모델링 → 성능 분석의 형태로 구성되어 따라 하며 프로젝트를 완성할 수 있다.


이 책의 대상 독자
시계열 데이터를 활용하고자 하는 데이터 분석가
시계열 데이터를 활용하여 보고서를 작성하고 시각화를 해야 하는 학생, 직장인 등

 

지은이 소개

이기준

한국항공대학교에서 컴퓨터공학으로 박사 학위를 받았다. 1999년에 한국교육개발원 교육통계실에 입사하여 유/초/중/고등 교육기관의 교육통계, 고등 교육기관의 취업통계에 대한 DB, 조사, 서비스 시스템을 개발 및 관리하였고, 한국교육개발원 전산실을 거쳐 미국 보이시 주립대학교(Boise State University) 교육공학과에서 초청연구원으로 연수하였다. 교육통계센터 통계기획팀장, 취업통계조사팀장, 국가교육통계연구본부장을 역임하며 교육통계 데이터를 활용한 분석 연구를 수행하기도 했다.
국가교육통계 조사, 관리, 분석, 서비스 시스템의 기획, 개발, 운영, 관리 실무부터 총괄 책임까지 전 분야를 수행했고, 현재 한국교육개발원 교육통계센터소장으로 근무 중이다. 이 외에 대통령 직속 4차산업혁명위원회 자문위원, 교육부 인공지능 교육정책 자문위원, 교육부 청년취업정책 자문위원, 통계청 통계분류 자문위원, 2018 평창동계올림픽 IT 자문위원 등으로 활동하기도 했다.

 

 

추천사


"저자가 20여 년간 우리나라의 교육통계 데이터를 다뤄 오면서 겪었던 다양한 실무에서의 경험을 이 책에서 자세히 설명하고 있어 시계열 데이터 분석을 시작하는 초보자들이 겪을 수 있는 다양한 문제에 대해서도 많은 참고가 될 것으로 생각됩니다."

한국 오라클 대표이사 탐 송

"이 책은 시계열 데이터 분석을 원하는 분석가나 미래의 분석가를 희망하는 학생들에게 필독서로서 매우 큰 도움이 될 것입니다."

한국항공대학교 소프트웨어학과 교수 황수찬

"이 책은 시계열 데이터 분석과 예측의 대중화에 기여하게 될 것입니다."

KT 공공/금융고객본부 상무 김지훈

"이 책이 단순한 데이터 분석 코드의 차원을 넘어 빅데이터를 활용할 수 있는 데이터 사이언스 학문과 산업이 왜 존재해야 하는지에 대한 분명한 이유를 설명하는 중요한 역할을 할 것으로 기대합니다."

개인정보보호위원회 개인정보보호정책과장 부이사관 이병남


 

차례

1장 시계열 데이터 1

1.1 시계열 데이터란? 3

1.2 시계열 데이터의 특성 5

1.2.1 시간 독립변수 5

1.2.2 자기상관 관계 6

1.2.3 추세 경향성 7

1.2.4 계절성, 순환성 8

1.2.5 불확실성 9

2 시계열 데이터 객체 11

2.1 날짜/시간 데이터 클래스 12

2.1.1 date 클래스 12

2.1.2 POSIXct, POSIXlt 클래스 13

2.1.3 yearmon, yearqtr 클래스 15

2.1.4 날짜, 시간 포맷 16

2.2 시계열 데이터 객체 17

2.2.1 ts 17

2.2.2 xts 18

2.2.3 tsibble 20

2.3 시계열 데이터 import 22

2.3.1 엑셀 파일 23

2.3.2 CSV 파일 25

2.3.3 추가 실습 데이터 생성 26

더보기
3장 시계열 시각화 31

3.1 data.frame: ggplot2 패키지 32

3.2 xts: xts 패키지 41

3.3 ts: forecast 패키지 46

3.4 tsibble: feasts 패키지 50

3.5 data.frame: timetk 패키지 54


4장 시계열 데이터 처리 59

4.1 오늘 며칠일까?: 시간 정보 추출 60

4.2 며칠 지났을까?: 시간 기간 연산 61

4.3 이번 주 마지막 날은 며칠일까?: 시간 반올림 65

4.4 주간, 월간 데이터 합계, 평균은?: 시간 그루핑 66

4.5 주식 시가, 고가, 저가, 종가는 어떻게 구할까?: OHLC 78

4.6 3일 평균, 5일 합계는?: 시간 롤링 79

4.7 지난 달 데이터는?: 필터링 83

4.8 월별, 분기별, 연별 증감량 88

4.9 월 비중 백분율, 연 비중 백분율 92

4.10 월별, 분기별, 연별 누적 합계 96

4.11 동월별, 동분기별, 동년별 플롯 100

5장 시계열 forecasting Part I - 기초 개념 107

5.1 정상성, 비정상성 109

5.2 지연과 차분 111

5.3 ACF PACF 116

5.4 적합값과 잔차 123

5.5 백색잡음 124

5.6 시계열 분해 127

5.7 정상성 테스트 131

5.8 계절성 검정 133

6장 시계열 forecasting Part II - 시계열 예측 모델 137

6.1 평균 모델 139

6.2 단순 모델 142

6.3 계절성 단순 모델 146

6.4 랜덤워크 모델 148

6.5 회귀 모델 160

6.5.1 forecast::tslm 161

6.5.2 timetk::plot_time_series_regression 167

6.6 지수 평활 모델 170

6.6.1 단순 지수 평활 모델 170

6.6.2 홀트 모델 176

6.6.3 홀트 윈터 모델 182

6.6.4 ETS 모델 183

6.7 ARIMA 모델 188

6.7.1 자기회귀 모델 189

6.7.2 이동평균 모델 193

6.7.3 ARIMA 모델 결정 198

6.7.4 Seasonal ARIMA 모델 208

6.8 TBATS 모델 219

6.9 prophet 모델 221

6.10 신경망 모델 226

7장 시계열 forecasting Part III - 시계열 분석 프레임워크 229

7.1 성능 분석 지수 230

7.1.1 MAE 230

7.1.2 RMSE 231

7.1.3 MPE 232

7.1.4 MAPE 233

7.2 fable 프레임워크 234

7.2.1 미래 학생수 예측 235

7.2.2 미래 취업자수 예측 239

7.2.3 미래 코로나 확진자수 예측 242

7.3 modeltime 프레임워크 246

7.3.1 미래 학생수 예측 248

7.3.2 미래 취업자수 예측 255

7.3.3 미래 코로나 확진자수 예측 259

찾아보기 264

 

■ 제이펍 소식 더 보기(제이펍의 소통 채널에서 더욱 다양한 소식을 확인하세요!)

네이버 책 포스트 유튜브 인스타그램 트위터 페이스북