AI代理需要终端,而非仅依赖向量数据库

传统检索的局限

在传统检索系统(如RAG)中,文档先被切分成小块,转化为向量表示并离线存储于向量数据库。当AI系统处理查询时,检索器会筛选整个数据库,返回按相关性排序的“top-k”文档片段。所有证据必须通过这一评分机制,才能进入后续推理阶段。然而,现代代理应用的需求远超于此。研究者指出:“密集检索擅长广泛语义召回,但代理解决多步任务时,常需搜索精确字符串、数字、版本号、错误代码或稀疏线索组合。这些长尾细节恰恰是语义相似性最脆弱的领域。”

与静态搜索不同,代理需根据局部证据动态调整搜索计划。精确的词汇约束和多步假设优化难以通过语义检索器实现。由于检索器将访问压缩为单一步骤,任何被相似性搜索过滤掉的关键证据,无论代理后续推理能力多强,都无法恢复。研究者解释,当前检索流程可能成为瓶颈,因为“它们过早决定了代理能‘看到’的内容”。

直接语料库交互(DCI)

这种直接访问解决了企业环境中的核心问题:数据陈旧。向量索引始终是特定时间点的快照,构建和维护需大量计算和时间成本。

研究者表示:“在多数企业场景,数据并非静态文档集合,而是每日财务报告、实时日志、工单、代码提交、配置文件、事件时间线等持续变化的资料。”DCI让代理直接基于工作空间的当前状态推理,而非依赖昨日的向量索引。

代理在终端式环境中运行,观察的是原始工具输出,如文件路径、匹配文本片段及上下文行。DCI提供少量但表达能力强的核心工具:代理用“find”“glob”导航目录结构、定位文件;通过“grep”“rg”实现精确匹配,搜索关键词、正则表达式或确切字符串;借助“head”“tail”“sed”“cat”及轻量Python脚本,可查看匹配上下文或读取文件特定部分。

代理可通过shell管道组合工具,执行复杂搜索逻辑。例如,通过管道强制执行严格词汇约束(如先在文件中搜索一个术语,再将输出传递给第二个搜索);或通过查找特定文件类型、搜索“report”关键词并筛选“2024”年份,整合多个弱线索;还能通过检查关键词匹配的精确行,即时验证假设。

DCI将语义解释权直接交给代理,而非依赖基于嵌入的相似性搜索。代理可提出假设、测试精确词汇模式,提取传统语义检索器可能遗漏的详细信息。

研究者提出了两种系统版本。DCI-Agent-Lite是轻量级低成本方案,基于GPT-5.4 nano模型,仅支持bash命令和基本文件读取。因读取原始文件易耗尽小模型内存,该版本依赖轻量级运行时上下文管理策略,维持长期探索。

DCI-Agent-CC是高性能版本,面向计算预算更充足的团队,运行在Claude Code上(由Claude Sonnet 4.6驱动)。Claude Code提供更强提示、更稳健的工具编排和更优的内置上下文处理,提升代理在跨异构数据集复杂多步搜索中的稳定性。

DCI的实际应用

研究者通过BrowseComp-Plus等代理搜索基准、需单跳或多跳推理的知识密集型QA,以及要求领域推理和科学事实核查的信息检索排名任务,测试了两种DCI版本。

他们对比了三类基线:第一类包括Search-R1等开源权重检索代理,及GPT-5、Claude Sonnet 4.6等前沿模型驱动的专有代理,搭配标准检索器;第二类包括BM25等传统稀疏检索器,及OpenAI text-embedding-3-large、Qwen3-Embedding-8B等密集检索器;第三类为ReasonRank-32B、Rank-R1等高性能推理导向重排序器。

据研究者称,DCI系统性地优于基线。在复杂的BrowseComp-Plus基准测试中,将Claude Sonnet 4.6上的传统Qwen3语义检索器替换为DCI,准确率从69.0%提升至80.0%,同时API成本从$1,440降至$1,016。轻量代理的投入产出比也显著:DCI-Agent-Lite(GPT-5.4 nano)在成本上比使用传统检索的OpenAI o3模型低超$600。

在多跳QA基准中,DCI-Agent-CC达到83.0%平均准确率,比最强开源权重检索基线高出30.7个百分点。

数据显示,DCI的文档整体召回率低于密集嵌入模型,但一旦找到相关文档,能从中提取更多价值。

研究者指出:“若企业AI负责人询问DCI最适用的场景,我会指向需在动态工作空间中精确定位证据的任务:调试生产事故、搜索大型代码库、分析日志、合规调查、审计追踪或多文档根因分析。”

在一个复杂的深度研究任务中,代理需根据12个互锁线索(包括精确出席人数、黄牌数、球员出生日期)识别特定足球比赛。传统检索器会因返回零散片段而失败,而DCI代理通过浏览文件目录、读取1990年英格兰对比利时比赛报告的特定行验证换人次数、提取采访文件中的引语、查看维基百科文本文件确认两名球员出生日期,链式执行简单命令,确保无证据永久丢失。


关注微信号:智享开源 ,及时了解更新信息。

原文链接:https://venturebeat.com/orchestration/your-ai-agents-need-a-terminal-not-just-a-vector-database

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章959篇


关注微信

主站最新信息

[blog_mailer_subscribe]

分类