Anthropic欲掌控AI代理核心功能,企业需警惕

就在宣布Claude托管代理几周后,Anthropic通过三个新功能更新了其平台,将记忆、评估和多代理编排等基础设施层整合到一个单一运行时中。

这一举措可能对许多企业拼凑的独立工具构成威胁。

Anthropic在新闻稿中表示,这些新功能——”梦境”、”成果”和”多代理编排”——旨在让Claude托管代理中的代理”在处理复杂任务时具备更强的能力,且需要最少的引导”。

“梦境”处理记忆,代理通过”反思”其多个会话并整理记忆来学习并发现未知模式。”成果”允许团队定义和设置特定标准来衡量代理的成功,而”多代理编排”则将任务分解,使主代理能够委托给其他代理。

新功能整合核心能力

Claude托管代理理想上为企业提供了更简单的代理部署路径,并将编排逻辑嵌入模型层。这是一个管理状态、执行图和路由的端到端平台。随着”梦境”、”成果”和”多代理编排”的加入,Claude托管代理进一步扩展了能力,并直接与LangGraph或CrewAI等工具以及外部评估框架、RAG记忆架构和QA循环竞争。

集成化带来的威胁

企业现在必须问自己:我们应该放弃灵活的模块化系统,转而选择一个几乎将所有功能都内部化的代理平台吗?

Anthropic设计的Claude托管代理在一个地方共享上下文、状态和可追溯性。这意味着平台可以看到代理做出的每一个决策,而不是企业必须将单独的系统连接起来。拥有一个包罗万象的平台听起来很实用,但并非所有企业都想要一个全服务系统。

Claude托管代理已经面临批评,因为它鼓励供应商锁定,因为它拥有管理代理的大部分架构和工具。在当前模式下,组织可能会运行托管代理,但将多代理编排、记忆或评估保留在独立空间,以确保灵活性。

该平台提供完全托管的运行时,这意味着内存和编排在非企业拥有的基础设施上运行。对于一些必须证明数据驻留合规性的组织来说,这可能成为噩梦。

另一个需要考虑的问题是,已经处于大规模AI转型中的企业必须拼凑解决方案来应对其技术栈的限制。并非每个工作流程都可以通过切换到Claude托管代理轻松替换。

与现有工具的竞争

大多数企业采用碎片化的AI部署方法。

例如,他们可能使用LangGraph或Crew AI进行代理路由和工作流管理,使用Pinecone作为向量数据库进行长期记忆,使用DeepEval进行外部评估,并使用人工介入质量保证来审查某些任务。Anthropic希望摆脱所有这些。

通过”梦境”,Anthropic通过允许用户在会话之间主动重写记忆来处理记忆,从而使代理从错误中学习。Anthropic表示,此功能对长期状态和编排很有用。当前系统通常通过存储嵌入、检索相关上下文并随时间添加更多状态来处理记忆持久性。

“成果”通过详细说明代理的期望来解决评估部分。Anthropic将评估带入编排层,而不是在之上,而不是外部质量检查,这些检查通常由一组人工完成。

但正是”多代理编排”功能使Claude托管代理与微软、LangChain、CrewAI等编排框架竞争。像Anthropic和OpenAI这样的模型提供商已经开始积极进入这个空间,认为将此功能带到模型层可以让团队获得更好的控制。

企业的关键决策

企业面临重大决策,这可能取决于其代理成熟度。

如果组织仍处于代理实验阶段,尚未在生产中部署许多代理,他们可能会发现迁移到Claude托管代理并根据需要配置”梦境”和”成果”要容易得多。这是开发阶段,即使企业使用第三方编排器如LangChain,他们仍在进行定制。

但对于那些已经更深入过程的企业,计算变得更加棘手。这现在是一个并行评估和更好理解其流程的问题。

然而,即使企业不打算使用Claude托管代理,它们也将面临相同的决策。Anthropic已经发出信号,其他模型和平台提供商可能会将产品路线图转向类似模型,将所有内容锁定在同一系统中——因为模型可能变得可互换,但工具和编排基础设施不会。


关注微信号:智享开源 ,可及时获取信息

原文链接:https://venturebeat.com/orchestration/anthropic-wants-to-own-your-agents-memory-evals-and-orchestration-and-that-should-make-enterprises-nervous

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章616篇


关注微信

主站最新信息

分类