干货！构建监控日志分析和预警Agent的一种思路

否子戈

发布于 2024-05-03 13:56:36

2380

发布于 2024-05-03 13:56:36

文章被收录于专栏：码码

我在2017年的时候参与当时所在公司的技术论坛，提到监控日志在人工智能的加持下，可实现更及时的告警，甚至是提前预警。然而，当时对这一领域只是一种设想，真正怎么去做和落地，完全没有思路。7年过去了，即使到了今天，这一话题仍然是研发领域的重磅话题，可仍然没有公开的技术解决方案。前两天在研究模型微调时，突然来了灵感，或许这是一种思路，能够实现多年来的期许。

先说结论：用多模态的训练思路，将日志作为时间序列，对齐到文本。

最早利用人工智能来处理监控的方式，也是目前监控领域的主要模式，主要是利用大数据进行规则匹配，再辅以对应模型的分析来达到预警效果。但是这种方案始终存在着缺陷，不仅精准度不够，时效性也不足。

在LLM成为主流之后，我很简单的认为，既然日志是文本，那么把所有日志都给大模型，再辅助一些文字描述，让大模型主动意识到日志之间的规律即可。然而，这种方案效果很差，因为大模型对日志的理解仍然停留在文本层面，无法真正理解日志间的联系，想要达到我们预警的目标就差的更远。

前两天突然来了灵感，多模态既然可以理解图片，甚至视频，可以理解时间序列，那么作为天然的时间序列的监控日志，为什么一定要把它当作文本呢？让它返璞归真，把监控日志作为源域，把文本作为目标域，把日志序列对齐映射到自然语言文本，实现和多模态一样原理的训练过程。

就像我们训练统计图到文本描述一样，首先对源域材料token化，这里主要依靠时间区间划分来作为token，然后在实现对齐文本，用文本去描述区间本身的特征，以及区间之间的变化特征。举个浅显易懂的例子，假如我们有如下一张图：