AIOps在运维系统中的整合-复杂问题排查
在上一篇文档中实现了检查单台服务器故障的典型排错场景。此次我们加大难度
一、排查链路中故障,识别南北向流量走向并给出排查结果
难点
- 模型无法理解私有环境
- 给出的建议具备安全风险
思路
- 结合提示词,使用function call功能来准确获取配置
- 新增the_supervisor角色,对planer的建议安全过滤
二、与真实用户交流,给出域名申请建议并检测是否可用
难点
- 引导用户使用合规的子域名
思路
- 提示词约定规范,使用socket库来判断可用性
整体难点,多agent执行顺序,“技能绑定”,来看效果。图1为用户与gatekeeper探讨需求
图2为agent建议用户使用的解析记录
图3为正确路由南北向流量问题,并使用对应function判断
关键代码片段