Redis Iris:AI代理驱动上下文架构取代RAG,企业检索迎新突破

Redis Iris:AI代理驱动上下文架构取代RAG,企业检索迎新突破

Redis曾以缓存层闻名,如今瞄准了更具挑战性的问题:生产级AI代理的失败往往不是因为模型本身,而是因为其底层数据分散、过时,且为人类而非机器设计。为单一查询构建的检索管道无法应对代理产生的大量数据请求。

本周一发布的Redis Iris正是该公司的解决方案:一款上下文与记忆平台,介于代理与其所需数据之间。该平台集成了实时数据摄入、语义接口(可从业务数据模型自动生成MCP工具)以及基于Redis Flex的代理记忆服务器——这是一款重写的存储引擎,99%的数据存储在SSD上,成本仅为纯内存存储的十分之一。

这一发布正值企业RAG基础设施处于积极转型期。VentureBeat的2026年第一季度VB Pulse RAG基础设施市场追踪器显示,买家对混合检索的采用意图从1月至3月从10.3%飙升至33.3%。检索优化首次超越评估,成为企业首要投资优先级。自定义内部检索栈的比例从24.1%上升到35.6%,企业因现有方案无法满足需求而寻求定制化。

“企业将拥有比人类多几个数量级的代理,”Redis CEO Rowan Trollope对《VentureBeat》表示,“这意味着后端系统将承受多几个数量级的负载。”

从缓存到上下文

Trollope将这一转变追溯到移动时代:当为分行柜员构建的旧后端突然要服务数百万智能手机用户时,Redis成为吸收负载的缓存层,无需完全重建。但这一次不同——代理无法编写自己的中间件。在移动时代,开发者会与数据库管理员合作,识别应用所需的查询,并将缓存逻辑硬编码到中间件层。而代理需要在运行时通过预先构建的接口找到正确数据,否则会停滞。

“这就像把杂货店放进冰箱,”他说,“如果每次做三明治都要跑去杂货店买食材,效率很低。我们把冰箱放进每家每户,存一点食物。而我们现在的基础设施栈,就处于这种状态。”

Iris包含的五大组件

  • Redis Data Integration:现已全面可用。通过变更数据捕获管道,持续同步关系数据库、数据仓库和文档存储中的数据到Redis,支持Oracle、Snowflake、Databricks和Postgres等连接器。
  • Context Retriever:现处于预览阶段。开发者用pydantic模型定义业务数据的语义模型,Redis自动生成代理使用的MCP工具,服务器端强制执行行级访问控制。Trollope将这一转变描述为从传统RAG的“反向翻转”:“只是让代理拉取数据,而不是预先假设并填充到管道中。”
  • Agent Memory:现处于预览阶段。存储会话间的短期和长期状态,使代理无需在每次交互中重新推导上下文。
  • Redis Flex:重写的存储引擎,99%数据存储在SSD,1%在RAM,实现PB级检索的亚毫秒延迟。
  • Redis Search和LangCache:平台底层的检索与语义缓存骨干。LangCache通过缓存提示响应减少冗余模型调用。

分析师怎么看

数据行业目前正朝着相同方向前进,各大数据库厂商都在强调上下文层的重要性。传统数据库厂商(如Oracle)正在整合上下文和记忆层,将关系数据库带入代理式AI时代;专用向量数据库厂商(如Pinecone)也在构建新的知识层,为代理式AI提供上下文;独立的上下文层(如Hindsight)也是新兴格局的一部分。

Trollope认为Redis的定位与竞争对手有本质不同:“我们要赢,别人不一定输。”许多Redis部署已使用MongoDB或Oracle作为记录系统,Iris从这些系统中缓存和反射数据,而非替代它们。Redis已在Snowflake市场发布Iris,并提供原生连接器。

HyperFRAME Research的AI栈实践负责人Stephanie Walter对市场背景的总结很直白:“市场正在达成一致结论:代理不仅需要更多token或更好的模型,还需要受治理的、实时的、低延迟的上下文。”她对Redis差异化的看法集中在Redis在栈中的位置——接近运行时、对延迟敏感的运营状态和实时数据。“Redis的卖点不是‘更好的RAG’,而是‘代理在运行时需要实时上下文、记忆和快速检索’。”

无论Redis还是其他厂商,上下文层技术都面临治理挑战才能成功。“如果每个代理都成为新的成本中心、新的数据访问风险和新的治理例外,代理式AI在企业中无法规模化。”她说,“成功的上下文层将使代理更快、更便宜、更安全地运行。”

医疗领域的实时AI:上下文错误不可接受

Mangoes.ai是一家已在生产环境中解决这些问题的公司,其场景中,上下文错误的成本以患者结果衡量。该公司创始人兼CEO Amit Lamba运营着一个实时语音AI平台,部署在大型医疗机构,患者和临床医生通过该平台询问治疗、排班和病例史等实时问题。Mangoes.ai从最初就基于Redis构建其栈。

“检索、记忆和会话状态都通过Redis运行,因此我们无需拼接多个工具并希望它们能互相通信。”Lamba说。

Iris的动态记忆能力解决的是复杂会话中的问题:“想象一下一小时的团体治疗,你需要知道谁在何时说了什么,并在当下向治疗师提供正确信息。这不是简单的检索问题。”


关注微信号:智享开源 ,可及时获取信息

原文链接:https://venturebeat.com/data/context-architecture-is-replacing-rag-as-agentic-ai-pushes-enterprise-retrieval-to-its-limits

评论列表
 
 
发表评论
😀 😂 😃 😄 😅 😆 😉 😊 😋 😎 😍 😘 🥰 😜 😝 🤗 🤔 😭 😤 👍

为你推荐
Ta的个人站点

Mark Do发布文章814篇


关注微信

主站最新信息

[blog_mailer_subscribe]

分类