服务可用性评估标准规范

背景

  • 业务如何进行可用性管理,可用性规划背后的指导依据是什么
  • 如何低成本、快速获取成熟产品线的可用性保障能力

当前需要构建可用性评估标准,体系化拆解可用性保障能力,将组织级可用性管理经验沉淀融入标准,依据标准,量化评估产品线/平台可用性保障能力,发现可用性短板,指导可用性规划。

服务水平指标(SLI)

影响服务质量的一个具体量化指标。比较重要的指标有:请求延迟、错误率、系统吞吐量、可用性、持久性等。

服务水平目标(SLO)

服务的某个SLI的目标值,或者目标范围。SLO的定义是SLI<=目标值,或者范围下线<=SLI<=范围上线

SLO的选择和公布可以帮助设立用户对服务质量的预期。如果没有一个明确的SLO,用户经常会按自己的理解设置一个服务性能的预期,容易产生过度信任或信心不足两类问题。

服务水平协议(SLA)

指服务与用户之间的一个明确的,或者不明确的协议,描述了在达到或没有达到SLO之后的结果。这些结果可以是财务方面的——比如退款或罚款,也可能是其它类型的。

区别SLO和SLA的一个简单方法是问:如果SLO没有达到时,有什么后果?如果没有定义明确的后果,那么肯定是在讨论一个SLO。对外提供的企业产品,如收费云服务,一般都是有明确的SLA协议。

results matching ""

    No results matching ""