AI编码热潮冲击生产系统,Resolve AI用多智能体方案破解运维难题

Resolve AI推出新平台,应对AI编码热潮带来的生产系统挑战
由Greylock和Lightspeed Venture Partners支持的运维初创公司Resolve AI今日宣布平台全面升级,新增始终在线的背景代理、重新设计的调查架构及工程师与AI智能体实时协作的工作空间。这一升级旨在解决AI代码生成爆发式增长带来的生产系统稳定性问题,推动软件运维成为AI投资的新 frontier。
多智能体系统:团队协作提升根因分析准确率2倍
此次发布的核心是多智能体调查系统。不同于单智能体独立诊断故障(类似工程师独自值班),新平台派遣协同的专业智能体团队,并行探索多种假设、独立验证结论并构建从根源到症状的完整因果链。公司内部测试显示,该架构使根因分析准确率提升超2倍。
“单智能体如同人类独自值班,现在我们有了智能体团队,像人类团队协作调试问题,质量提升2倍。”Resolve AI CEO Spiros Xanthos在接受VentureBeat采访时表示。
准确性验证:基于数百真实案例的内部测试
任何初创公司的准确性声明都需审慎看待。2倍提升的数据来自内部基准测试,虽未第三方审计,但测试集模拟了企业客户日常面临的复杂场景。Xanthos透露,测试包含数百个案例,反映Coinbase、Salesforce、DoorDash、Zscaler等客户的真实生产故障。
这一提升的实践影响显著:智能体作为告警第一响应者,通常在5分钟内完成初步分类,人类工程师甚至无需介入。此前DoorDash曾通过该平台将根因定位时间缩短87%,Xanthos解释,传统情况下人类需5-10分钟才能开始排查,平均修复时间(MTTR)长达数十分钟至数小时,80%以上的提升相当于速度提升4-5倍。
防止“幻觉”:智能体互相验证确保结论可靠
大语言模型在关键生产环境中的常见问题是生成看似合理但错误的答案,可能导致团队在故障排查中走错方向。Resolve AI的应对机制是智能体间的分层验证:每个智能体必须引用证据并接受独立审查,其他智能体主动寻找逻辑漏洞以驳斥理论。
“智能体常因发现漏洞而驳斥理论,多层防御确保结论准确。”Xanthos强调。更关键的是系统会承认“未知”——只有证据充分时才给出答案,否则提供多条路径供参考。“生产系统中的AI不能是黑箱,在错误答案可能造成运营损失的场景,谨慎的不确定性比自信的结论更有价值。”
背景代理:持续处理运维任务,积累机构知识
除故障响应外,新平台引入背景代理,处理工程团队难以持续规模化完成的运维工作。这些代理按计划运行或自动响应事件(如新部署、告警触发),从每次调查和人类交互中积累知识。当工程师打开界面时,代理已预先调查优先问题、监控部署、审计告警质量、标记配置漂移并发现成本异常。
背景代理与故障响应智能体不同,可全天候运行,监控生产环境变化以预防问题。“客户现在用代理持续监控生产变更,避免潜在故障。”Xanthos说。这些代理被视为“通用SRE智能体”,可处理从监控成本变化到生成故障修复代码等任务,解决软件运维中持续维护生产健康的结构性问题。
关注微信号:智享开源 ,及时了解更新信息。

关注微信

还没有任何评论,你来说两句吧!