跳转到主要内容
在我们响应故障时,如果可以查看到历史上相似故障的解决方案,将极大加快故障解决效率。历史故障功能,正是为响应人员提供的一个已解决的相似的故障列表。对于不熟悉此问题的响应人员,可以快速查阅历史故障的时间线、根因和解决办法,并复制相关操作。历史故障提供了解决问题所需的上下文,也避免了响应人员遇到不熟悉问题时产生恐慌。

查看相似故障

控制台

1

找到故障

从故障列表或协作空间,找到一条需要处理的故障。
2

查看历史故障

点击故障标题,进入故障详情,在详情中选择 历史故障 标签页。
历史故障界面
系统会至多给出 5 条相似的历史故障,以避免信息太多导致您查阅辨识浪费更多时间。

排序原则

我们如何进行排序?
  1. 系统仅匹配相似度大于 90% 的故障
  2. 系统优先返回设置了更详细解决办法和问题根因的故障
  3. 系统优先返回相似度更高的故障
  4. 系统优先返回最近发生的故障
每次解决故障时,留下 解决办法问题根因 是一个好习惯,这会极大提升后来者响应故障的速度。

如何识别

系统使用机器学习模型来判定故障之间的相似程度,当相似度大于 90% 时,我们认为两条故障之间是相似的。 我们在判断相似度时,主要考虑以下因素:
因素说明
故障的标题标题文本的语义相似度
故障的详细描述描述内容的语义相似度
故障所影响的服务一般提取自 service 标签
故障中包含告警对象一般提取自 resource 标签
当检索历史故障时,系统仅匹配当前协作空间下的、已解决的相似故障。

常见问题

目前只能查看当前故障发生时间前 30 天内的相似故障。随着时间推移,系统可能会删除历史数据,这种情况下,您可能无法查看到历史故障。无论如何,对于当前正在发生的故障,您可以查阅至多 30 天的历史数据。
不可以,目前系统无标记功能。但您可以通过其他渠道与我们进行沟通和反馈。
  • 建议您对于重要的故障,完善填写问题根因和解决办法
  • 建议您尽量丰富故障的标签,尤其是 serviceresource 标签
  • 建议您丰富告警的标题和描述信息,更准确的表达故障现象