14.2、SLO SLI SLA定义
SLO/SLI/SLA 定义
欢迎回到第 14 章的学习。在上一节,我们学习了 KPI 基础概念。现在我们要学习 SLO/SLI/SLA 定义。
本节将学习:Service Level Objective (SLO)、Service Level Indicator (SLI)、Service Level Agreement (SLA)、以及三者关系。
Service Level Objective (SLO)
SLO 是什么? Service Level Objective,服务级别目标,定义服务应该达到的性能目标。
SLO 的作用是什么? SLO 帮助我们:
- 设定明确的性能目标
- 衡量服务质量
- 指导优化方向
- 评估服务表现
SLO 示例:
- API 可用性:99.95%
- API 响应时间:P95 < 200ms
- 错误率:< 0.1%
Service Level Indicator (SLI)
SLI 是什么? Service Level Indicator,服务级别指标,用于衡量服务质量的指标。
SLI 的作用是什么? SLI 帮助我们:
- 量化服务质量
- 追踪服务表现
- 评估 SLO 达成情况
SLI 示例:
- 可用性:成功请求数 / 总请求数
- 延迟:请求响应时间
- 错误率:错误请求数 / 总请求数
Service Level Agreement (SLA)
SLA 是什么? Service Level Agreement,服务级别协议,定义服务提供者和用户之间的协议。
SLA 的作用是什么? SLA 帮助我们:
- 明确服务承诺
- 定义违约责任
- 建立信任关系
SLA 示例:
- 承诺可用性:99.9%
- 违约赔偿:服务中断超过 0.1% 时间,提供补偿
- 服务时间:7x24 小时
三者关系
SLO/SLI/SLA 的关系是什么?
关系: SLI 用于衡量服务质量,SLO 定义服务目标,SLA 定义服务协议。
流程: 定义 SLI → 设定 SLO → 签订 SLA → 追踪和评估。
示例:
| 类型 | 定义 | 示例 |
|---|---|---|
| SLI | 服务级别指标 | 可用性百分比:99.9% |
| SLO | 服务级别目标 | 目标可用性:99.95% |
| SLA | 服务级别协议 | 承诺可用性:99.9%,违约赔偿 |
SLO 设定原则
SLO 设定原则包括哪些呢?
第一个:基于 SLI。 SLO 应该基于 SLI 设定。
第二个:可达成。 SLO 应该是可达成的目标。
第三个:有意义。 SLO 应该对业务有意义。
第四个:可追踪。 SLO 应该是可追踪的。
SLI 选择原则
SLI 选择原则包括哪些呢?
第一个:相关性。 SLI 应该与用户体验相关。
第二个:可测量。 SLI 应该是可测量的。
第三个:稳定性。 SLI 应该是稳定的。
第四个:代表性。 SLI 应该代表服务质量。
本节小结
在本节中,我们学习了 SLO/SLI/SLA 定义:
第一个是 SLO。 Service Level Objective,服务级别目标,定义服务应该达到的性能目标。
第二个是 SLI。 Service Level Indicator,服务级别指标,用于衡量服务质量的指标。
第三个是 SLA。 Service Level Agreement,服务级别协议,定义服务提供者和用户之间的协议。
第四个是三者关系。 SLI 用于衡量服务质量,SLO 定义服务目标,SLA 定义服务协议。
SLO 设定原则: 基于 SLI、可达成、有意义、可追踪。
SLI 选择原则: 相关性、可测量、稳定性、代表性。
这就是 SLO/SLI/SLA 定义。通过 SLO/SLI/SLA 定义,我们理解了服务级别管理的核心概念。
在下一节,我们将学习技术 KPI 设计。学习如何设计技术 KPI。