可用性/服务等级协议计算器
指导
可用性/服务等级协议计算器
将任何服务等级协议目标转换为您在一年、季度、月、周、日或小时周期内允许的精确停机预算。计算器支持三种模式:将SLA百分比转换为允许的停机时间,从最大停机时间倒推得出必须承诺的SLA百分比,以及跟踪当前周期内可用的活跃错误预算。
如何使用
- 在顶部选择一种模式:从SLA百分比计算停机时间,从目标停机时间计算所需SLA,或查看剩余错误预算。
- 在停机时间模式下,选择一个通用等级(99%、99.9%、99.99%、99.999%)或输入最多六位小数的任意自定义百分比。
- 在所需SLA模式下,输入您的服务可容忍的最大停机时间以及该时间必须持续的周期,例如每月30分钟。
- 在错误预算模式下,设置SLA,选择预算周期,并输入到目前为止已消耗的停机时间,以查看剩余部分。
- 结果会实时更新:显示一个概览值、按周期分解的详细信息、与常见SLA等级并列的对比表,以及适用情况下的可视化预算条。
特征
- 三种计算模式 – SLA到停机时间、停机时间到SLA,以及从单个界面跟踪活跃错误预算。
- 常见等级预设 – 一键选择99%、99.5%、99.9%、99.95%、99.99%和99.999%,以及您输入的任何自定义百分比。
- 可读性强的时间单位 – 结果以“8小时45分钟57秒”等形式呈现,而非原始秒数,以便值班人员能一目了然地阅读。
- 按周期分解 – 一次性查看SLA在年、季度、月、周、日和小时周期内的停机时间表现。
- 等级对比表 – 将选定的SLA与相邻等级进行比较,以判断是否值得承诺下一个九。
- 错误预算条 – 可视化仪表盘、已使用百分比,以及当剩余停机时间耗尽时的明确超预算警告。
- 符合标准的数学计算 – 使用365.25天的儒略年和30天的月,与SRE参考书籍和工具(如uptime.is)所采用的惯例一致。
- 完全客户端 – 所有计算均在您的浏览器中运行,因此SLA目标和事件数量永远不会离开您的设备。
常问问题
-
什么是服务等级协议(SLA)百分比?
SLA百分比描述了服务在定义周期内合同承诺的可用时间比例。例如,一个30天月周期内的99.9% SLA,允许大约43分钟的累计停机时间。该百分比始终与测量周期配对,因为相同的百分比在不同周期(如一天、一个月或一年)下会映射出非常不同的绝对时长。
-
如何从SLA百分比计算允许的停机时间?
允许的停机时间等于测量周期长度乘以(1减去SLA的分数形式)。如果周期为2,592,000秒(一个30天的月),SLA为99.95%,则停机预算为2,592,000乘以0.0005,即1,296秒,或21分钟36秒。该公式是确定性的,因此不同计算器之间的偏差源于对“月”或“年”的不同定义,而非四舍五入。
-
为什么计算器使用365.25天作为一年?
一个365.25天的年份,称为儒略年,能平均处理长期服务中的闰年,与SRE手册和uptime.is等工具所采用的惯例一致。使用精确的365天会在四年的闰年周期中低估预算六小时。对于短周期(如一个月)这一选择通常不重要,但在年度周期中,它可能使五九预算的停机时间相差数十秒。
-
什么是错误预算?
错误预算是指SRE团队在测量周期内允许消耗的累计停机时间,一旦超出即构成SLA违约。团队将其视为有限资源:如果发布活动在月初就耗尽了预算,则实施变更冻结;如果预算在周期末仍剩余,则鼓励更激进的发布。这一概念使工程和产品团队能够在可衡量的范围内权衡可靠性与发布速度。
-
SLA、SLO和SLI之间的区别是什么?
服务等级指标(SLI)是具体的测量值,例如成功请求的百分比。服务等级目标(SLO)是该指标的内部目标,通常比合同SLA更严格。服务等级协议(SLA)是与外部客户签订的合同,一旦未达成则会产生后果。错误预算通常基于SLO计算,以便团队在合同SLA面临风险前拥有预警空间。
