注册 | 登录读书好,好读书,读好书!
读书网-DuShu.com
当前位置: 首页出版图书科学技术计算机/网络软件与程序设计SRE工程师应知应会97件事

SRE工程师应知应会97件事

SRE工程师应知应会97件事

定 价:¥88.00

作 者: [加拿大]埃米尔 斯托拉尔斯基(Emil Stolarsky),[加拿大]詹姆 吴(Jaime Woo)
出版社: 中国电力出版社
丛编项:
标 签: 暂缺

购买这本书可以去


ISBN: 9787519876319 出版时间: 2023-06-01 包装: 平装-胶订
开本: 128开 页数: 字数:  

内容简介

  Incident Labs的联合创始人 Jaime Woo和Emil Stolarsky从整个行业收集了97条简单实用的技巧,包括值得信赖的z佳实践和解决棘手问题的新方法。通过了解发人深省的推动领域发展的问题,以及我们给出的合理建议,你将会提高和完善你的 SRE 技能。

作者简介

  Emil Stolarsky是一名SRE工程师,曾在Shopify和DigitalOcean的负责Kubernetes平台工作,负责缓存、性能和灾难恢复。业余时间里,他会听Flume的音乐,并通过攀岩来克服恐高症。Jaime Woo的职业生涯始于分子生物学,之后他热衷于讲故事,在DigitalOcean、Riot Games和Shopify 工作过,在那里他又重新开始了工程通信方面的工作。他是一位获得奖项提名的作家,也特别爱吃饺子。

图书目录

目录
前言 1
第1 章 用六个词来概括站点可靠性工程 6
Alex Hidalgo
第2 章 知道我们为什么真的需要可靠性么? 8
Niall Murphy
第3 章 构建自调节过程 10
Denise Yu
第4 章 SRE 家宴上的四个工程师 12
Jacob Scott
第5 章 可靠性堆栈 14
Alex Hidalgo
第6 章 基础设施:这就是力量所在 16
Charity Majors
第7 章 关于弹性的思考 18
Justin Li
第8 章 开发周期中的可观测性 20
Charity Majors, Liz Fong-Jones
第9 章 一切都是可以理解的 22
Bouke van der Bijl
第10 章 Wikipedia 是如何为你服务的 24
Effie Mouzeli
第11 章 为什么你应该对TCP 有所了解? 27
Julia Evans
第12 章 管理接口的重要性 30
Salim Virji
第13 章 说到存储,请考虑分布式 32
Salim Virji
第14 章 数据基数的作用 34
Charity Majors, Liz Fong-Jones
第15 章 安全就像洋葱 36
Lucas Fontes
第16 章 用话语记录 38
Tanya Reilly
第17 章 通往SRE 之路 40
Fatema Boxwala
第18 章 亲爱的未来团队 42
Frances Rees
第19 章 可持续性与职业倦怠 44
Denise Yu
第20 章 不要听从老师傅的建议 46
John Looney
第21 章 面对次的事故呼叫 48
Andrew Louis
第22 章 SRE,文化至上 50
Matthew Huxtable
第23 章 在小型组织中人人都是SRE 52
Matthew Huxtable
第24 章 审计你的环境以促进改善 54
Joan O’Callaghan
第 25 章 事故响应,从小处着手 56
Thai Wood
第26 章 独当一面的SRE:独自一个人影响大规模的变革 58
Ashley Poole
第27 章 设计SLO 度量的目标 60
Ben Sigelman
第 28 章 我有错误预算——现在怎么办 62
Alex Hidalgo
第29 章 如何改变现状 64
Joan O’Callaghan
第30 章 问题定位方法论 67
Avishai Ish-Shalom, Nati Cohen
第31 章 初创公司如何建立 SRE 思维 69
Tamara Miner
第32 章 自力更生,在企业中落地SRE ! 71
Vanessa Yiu
第33 章 不知道没关系,出错也没关系 73
Todd Palino
第34 章 讲故事是一种超能力 75
Anita Clarke
第35 章 让你的工作得到认可: 写一份自夸的文档 78
Julia Evans, Karla Burnett
第36 章 让大家看到你的工作成果 81
Lorin Hochstein
第37 章 被忽视的工程技能 84
Murali Suriar
第38 章 卸下远程值守的包袱 86
Jason Hand
第 39 章 事件处理大师 88
Andrew Louis
第40 章 毫不费力的事件管理 90
Suhail Patel, Miles Bryant, Chris Evans
第41 章 如果你在做运行手册,就把它们做好 92
Spike Lindsey
第 42 章 为什么我厌恶我们的流程手册 94
Frances Rees
第43 章 什么样的工具运行良好 97
Michelle Brush
第44 章 将同理心注入SRE 工具 99
Daniella Niyonkuru
第45 章 使用ChatOps 来实现共情 102
Daniella Niyonkuru
第46 章 迅速行动,唯快不破 104
Michelle Brush
第 47 章 能在生产系统中运行才算确认 106
Ingrid Epure
第 48 章 有时候修复本身就是问题 108
Jake Pittis
第49 章 传奇故事 110
Elise Gale
第50 章 监控指标不是SLI( 衡量一切的陷阱) 112
Brian Murphy
第51 章 当SLO 遭受质疑时如何去改善 114
Narayan Desai
第52 章 产品可靠性的整体方法 117
Kristine Chen, Bart Ponurkiewicz
第 53 章 寻找失去的时间 120
Ingrid Epure
第54 章 答疑时间的意外收获 122
Tamara Miner
第55 章 为内部客户建立他们真正想要使用的工具 124
Vinessa Wan
第56 章 个体和交互那些事 126
Vinessa Wan
第57 章 SRE 的人员能力基线 128
Effie Mouzeli
第58 章 远程高效或高效远程 130
Avleen Vig
第 59 章 余量和个体132
Kurt Andersen
第 60 章 系统余量的重要性 134
Kurt Andersen
第61 章 更少的电子表格,更多的餐巾纸 136
Jacob Bednarz
第62 章 巧妙地引入DevOps 138
Vinessa Wan
第63 章 在企业中有效的SRE 文化变革 140
Vanessa Yiu
第64 章 献给我爱的所有SRE 142
Felix Glaser
第65 章 复杂:技术中超负荷的词语 145
Laura Nolan
第66 章 我给团队的好建议 147
Nicole Forsgren
第67 章 创造你的工作清单 149
Daria Barteneva, Eva Parish
第68 章 按照SLO 操作 151
David K Rensin
第 69 章 英雄是必要的,英雄主义却不是 153
Lei Lopez
第70 章 人们愿意参加的值班工作 155
Miles Bryant, Chris Evans, Suhail Patel
第71 章 学习研究人的因素和团队文化,进而改善呼叫器的疲劳度 157
Daria Barteneva
第72 章 优化恢复的平均时间 159
Spike Lindsey
第73 章 减轻和预防级联故障 161
Rita Lu
第74 章 实时健康度:可以衡量的指标 163
Caitie McCaffrey
第75 章 帮助领导者优先考虑实时健壮性的问题 165
Caitie McCaffrey
第76 章 作为外交官的SRE 168
Johnny Boursiquot
第 77 章 前瞻性部署的SRE 170
Johnny Boursiquot
第78 章 检验你的灾备计划 172
Tanya Reilly
第79 章 为什么对于SRE 实践来说培训是重要的,
并且对于培训课程来说SRE 很重要 174
Jennifer Petoff
第80 章 单一化的力量 177
Chris Evans, Suhail Patel, Miles Bryant
第81 章 每个用户价值对应的字节数 179
Arshia Mufti
第82 章 把工程博客提上议事日程 181
Anita Clarke
第83 章 要让任何人在你的上下文里运行代码 183
John Looney
第84 章 交易场所:站点可靠性工程和产品 185
Shubheksha Jalan
第85 章 透过团队看产品 187
Avleen Vig
第86 章 性能储备金 189
Dawn Parzych
第87 章 重要但不紧急:SRE 路线图 191
Laura Nolan
第88 章 那些50% 的事儿 193
Tanya Reilly
第89 章 遵循安全关键系统之路 195
Heidy Khlaaf
第90 章 适合且可实现的静态分析 197
Heidy Khlaaf
第91 章 形式化规范的重要 200
Hillel Wayne
第92 章 社会技术系统中的风险与腐烂 202
Laura Nolan
第93 章 危机中的SRE 204
Niall Murphy
第94 章 预期的风险限制 206
Blake Bisset
第95 章 跨越局部风险:细数愤怒的小鸟 208
Blake Bisset
第96 章 来自软件安全专业人士的一些建议 210
J Paul Reed
第97 章 故障:让我们有机会一窥缺陷 212
Lorin Hochstein
第98 章 第三代SRE 214
Bj?rn “Beorn” Rabenstein
作者介绍 216
编者介绍 237

本目录推荐