본문 바로가기

도서 소개

사이트 신뢰성 엔지니어링: 구글이 공개하는 서비스 개발과 운영 노하우


다음 단계로 성장하기 위한 영감으로 가득한 책!

실제로 동작하는 코드가 가장 중요하다고 여기는 구글의 원칙을 체험한다!


출판사 제이펍

저작권사 오라일리(O'Reilly)

원서명 Site Reliability Engineering: How Google Runs Production Systems(원서 ISBN: 9781491929124)

저자명 벳시 베이어, 크리스 존스, 제니퍼 펫오프, 니얼 리처드 머피

역자명 장현희

출판일 2018년 1월 18일

페이지 624쪽

판 형 46배판변형(188*245*29)

제 본 무선(soft cover)

정 가 36,000원

ISBN 979-11-88621-08-8 (93000)

키워드 구글 / 소프트웨어 개발 / 분산 시스템 / SRE / 장애 관리 / 신뢰성

분야 컴퓨터공학 / 운영 및 관리


관련 사이트

아마존 도서 소개 페이지

■ 원출판사 도서 소개 페이지


관련 포스트

2018/01/11 - [출간전 책소식] - 알토란 같은 구글 서비스의 개발과 운영 노하우를 공개하다


관련 시리즈

■ (없음)


관련 도서

실리콘밸리 견문록: 창조와 혁신의 현장을 가다


관련 파일 다운로드

■ (없음)



강의보조 자료

교재로 채택하신 분들은 메일을 보내주시면 아래의 자료를 보내드리겠습니다: jeipubmarketer@gmail.com

■ 본문의 그림과 표


샘플 PDF(차례, 추천사, 옮긴이 머리말, 머리말, 이 책에 대하여, 베타리더 후기, 1장 '소개', 2장 'SRE 관점에서 바라본 구글의 프로덕션 환경')

사이트신뢰성엔지니어링_sample.pdf


정오표 페이지

http://jpub.tistory.com/786

도서구매 사이트(가나다순)


도서 소개

다음 단계로 성장하기 위한 영감으로 가득한 책!

실제로 동작하는 코드가 가장 중요하다고 여기는 구글의 원칙을 체험한다!


소프트웨어 시스템의 수명은 보통 디자인이나 구현 단계가 아니라 실제로 사용되는 기간에 좌우된다. 그렇다면 어째서 소프트웨어 엔지니어는 대용량 컴퓨팅 시스템을 디자인하고 구현하는 과정을 가장 중요하게 생각해 온 것일까?


이 책에서는 구글의 사이트 신뢰성 엔지니어링팀의 핵심 구성원들이 소프트웨어의 전체 생명주기에 집중함으로써 세계에서 가장 거대한 소프트웨어 시스템을 구현하고, 배포하고, 관측하며, 유지하는 방법과 그 이유를 다양한 에세이와 사설을 통해 소개한다. 이를 통해 구글 엔지니어들이 더 확장 가능하고, 신뢰할 수 있으며, 효과적인 시스템을 구축할 수 있었던 원리와 사례를 여러분의 조직에도 적용할 수 있게 될 것이다.


이 책의 주요 내용

  • 소개: 사이트 신뢰성 엔지니어링이 무엇인지, 그리고 기존 IT 분야의 사례와는 어떻게 다른지를 소개한다.
  • 원리: 패턴과 행동 양식, 그리고 사이트 신뢰성 엔지니어의 작업에 영향을 미치는 여러 사안을 소개한다.
  • 사례 연구: SRE의 일과인 대용량 분산 컴퓨팅 시스템을 구축하고 운영하기 위한 이론과 사례들을 학습한다.
  • 관리: 구글이 권장하는 신규 입사자에 대한 교육, 의사소통, 회의 진행 방식 등을 자신의 조직에 적용하기 위한 방법들을 살펴본다.


추천사

구글의 SRE(Site Reliability Engineering)는 원칙과 실습, 그리고 아키텍처 패턴은 물론 개발팀이 세계 최고 수준의 신뢰도와 지속적 배포 도구를 말도 안 되는 스케일에 적용할 수 있는 문화를 서술함으로써 IT 분야의 수많은 서비스에 지대한 영향을 미쳤다. 이 책은 독자 개개인뿐만 아니라 독자가 소속된 조직 전체가 반드시 읽고 자신의 것으로 소화해낼 가치가 충분한 책이다.

제즈 험블(Jez Humble), 《신뢰할 수 있는 소프트웨어 출시(Continuous Delivery)》의 공동 저자


나는 구글이 처음으로 시스템 관리자 콘퍼런스(Systems Administration Conferences)에서 진행했던 발표를 기억한다. 마치 질라 몬스터(Gila monster, 역주 미국의 도마뱀으로 독을 가지고 있다) 전문가가 나와서 진행하는 파충류 쇼의 대담을 듣는 기분이었다. 내가 늘 접하던 세계와는 완전히 다른 세계의 이야기를 듣는 것은 너무나도 흥미진진했지만, 결국 청중들은 자신의 애완 도마뱀으로 다시 눈길을 돌리고 말았다.

이제 우리는 구글의 그것과 비교하면 훨씬 작은 규모의 서비스라 하더라도, 그간 구글이 축적해온 노하우 없이는 제대로 운영할 수 없는 세상에 살고 있다. 덕분에 수년 동안 조용히 발전해오던 SRE의 사례들이 이제야 갑자기 폭발적인 관심의 대상이 되었다. 스케일과 신뢰도, 그리고 운영에 관련된 도전에 직면한 사람이라면 이 책을 반드시 읽어야 할 것이다.

데이비드 N. 블랭크-애들맨(David N. Blank-Edelman), USENIX 이사회 이사이자 SREcon의 공동 개최자


구글이라는 마법의 성을 떠난 후로 나는 줄곧 이 책이 출간되기만을 기다렸다. 이 책은 내 직장 동료들에게도 전파한 일종의 복음과도 같은 책이다.

뵨 라벤슈타인(Björn Rabenstein), SoundCloud의 엔지니어링팀 리더, 2013년까지 구글 SRE에서 근무했던 천상 개발자


사이트 신뢰도 엔지니어링이라는 개념을 연구해온 회사가 직접 저술한, 농익은 내용이 돋보이는 책이다. 기술적인 세부사항뿐만 아니라 프로세스와 목표, 원칙, 그리고 시간이 흐르면서 축적된 경험까지 모두 서술하고 있다. 진정한 의미의 SRE를 알고 싶다면 이 책이 그 답이다.

루스 올베리(Russ Allbery), SRE 및 보안 엔지니어


구글의 개발자들은 거대한 스케일과 높은 신뢰도를 모두 이룩한 구글의 서비스들을 개발해 오면서 자신들이 시행했던 프로세스나 겪은 실수들을 이 책을 통해 모두 공유하고 있다. 확장 가능한 통합 서비스를 만들고자 하는 사람이라면 누구나 이 책을 읽어볼 것을 강력히 권하는 바다. 이 책은 유지보수가 쉬운 서비스를 구현하기 위한 최고의 가이드다.

릭 패로우(Rik Farrow), USENIX


지메일 같은 대용량 서비스를 개발하는 일은 결코 쉬운 일이 아니다. 하지만 이런 서비스들을 신뢰성 있게 운영하는 것은 그보다 더 어려운 일이다. 특히, 이 서비스들이 거의 매일 수정되고 업그레이드되는 상황이라면 더더욱 그렇다. 이 책은 구글이 이 어려운 일을 어떻게 해냈는지를 보여주는 일종의 ‘레시피’다. 그러나 이 책으로 인해 그들이 저질렀던 실수들을 내가 반복하지 않게 된다면, 책값이 결코 비싼 수업료가 아니라는 것을 알게 될 것이다.

우르스 회즐(Urs Hölzle), 구글의 테크니컬 인프라스트럭처 SVP


지은이 소개

벳시 베이어(Betsy Beyer)

구글의 기술 문서 작성 담당자다. 현재 미국 뉴욕에 거주하고 있으며, 사이트 신뢰성 엔지니어다. 예전에는 마운틴 뷰를 비롯해 전 세계에 분산된 데이터센터를 관리하는 구글 데이터센터 및 하드웨어 운영팀의 문서를 작성하기도 했다. 뉴욕으로 이주하기 전에는 스탠퍼드 대학교에서 기술 문서 작성법을 강의하였다. 현재의 직업을 갖기 전에는 국제 관계학 및 영문학을 전공했으며, 스탠퍼드와 투레인 대학교에서 학위를 받았다.


크리스 존스(Chris Jones)

하루 28억 개의 요청을 처리하는 PaaS 클라우드 제품인 구글 앱 엔진의 사이트 신뢰성 엔지니어다. 샌프란시스코에 거주하고 있으며, 사이트 신뢰성 엔지니어로 활동하기 전에는 구글의 광고 분석, 데이터 웨어하우징 및 고객 지원 시스템을 담당했었다. IT 교육과 정치 캠페인의 데이터 분석, BSD 커널에 대한 기여, 컴퓨터 엔지니어링, 경제학 및 기술 정책에 대한 학위 취득 등에 열정을 쏟고 있으며, 전문 엔지니어 자격증도 소지하고 있다.


제니퍼 펫오프(Jennifer Petoff)

아일랜드 더블린에 거주하고 있는 구글의 사이트 신뢰성 엔지니어링팀의 프로그램 관리자다. 예전에는 과학 논문, 엔지니어링, 인적 자원 및 광고 운영 등 광범위한 분야에 걸친 글로벌 프로젝트를 관리했었다. 구글에 합류하기 전에는 화학 분야에 8년간 종사하기도 했었다. 스탠퍼드 대학교에서 화학 박사 학위를 받았으며, 로체스터 대학교에서 화학 학사와 심리학 석사 학위를 받았다.


니얼 리처드 머피(Niall Richard Murphy)

구글 아일랜드에서 광고 플랫폼의 사이트 신뢰성 엔지니어링팀을 이끌고 있다. 인터넷 분야에서 21년째 경력을 쌓고 있으며, 아일랜드의 협력 허브인 INEX의 의장이기도 하다. 오라일리의 《IPv6 Network Administration》을 비롯한 다수의 기술 서적 및 논문의 공동 저자인 그는 여러 RFC 문서 작성에도 기여한 바 있다. 현재 아일랜드의 인터넷 역사를 공동 집필 중이며, 컴퓨터 공학, 수학 및 (다소 생뚱맞지만) 문학 학위를 소지하고 있다. 현재 아내와 두 아들과 함께 더블린에 거주하고 있다.


옮긴이 소개

장현희

19년째 개발자의 길을 걷고 있는 옮긴이는 지난 17년간 총 20여 종의 개발 관련서를 집필하거나 번역했다. 현재는 호주 시드니에 있는 ROKT에서 테크니컬 스페셜리스트로 근무 중이며, 국내 개발자들에게 조금이라도 도움되는 번역서를 만들기 위해 틈틈이 노력하고 있다. 앞으로도 책이라는 매개체를 통해 멀리서나마 국내 개발자들과 계속해서 소통할 계획이다.


차례

PART I 소개

CHAPTER 01 소개 _ 3

서비스 관리를 위해 시스템 관리자를 활용하는 방법 _ 3

서비스 관리에 대한 구글의 해법: 사이트 신뢰성 엔지니어링 _ 5

SRE의 신조 _ 8

마무리하며 _ 14