当前位置: 首页 » 资讯 » 新科技 » 正文

Agentic AI时代,向量数据库成“必选项”

IP属地 中国·北京 钛媒体APP 时间:2025-12-05 14:18:25

从ChatGPT问世,到Agentic AI(代理式AI)逐步“照进现实”,新一轮AI技术快速发展的背后,对底层基础设施建设也提出了新的要求。

当OpenAI的GPT-4开始展现出自主任务分解能力,当AutoGPT、Devin等智能体能够独立完成复杂工作流程,一个根本性问题摆在整个AI产业面前:这些有记忆、会反思、能行动的Agent,究竟该把它们的“海马体”存放在哪里?传统数据库的磁盘I/O、精确匹配与静态架构,在高频读写、语义模糊、成本敏感的Agentic AI时代显得格格不入。向量数据库,这个曾被视为AI“锦上添花”的技术,正迅速从幕后走向台前,成为支撑下一代智能体系统的关键基础设施。

Agentic AI对数据库提出了新要求

生成式AI以内容创造为核心,Agentic AI以自主决策交互为特征,二者的快速演进推动向量数据库从基础存储检索工具向AI能力基座升级,催生出在数据处理、性能表现、功能适配等多维度的全新需求,据Gartner预测,2025年Agentic AI市场规模将突破千亿美元,年复合增长率超65%。这一爆发式增长背后,是向量数据库技术的持续突破。

2023年初,当ChatGPT掀起第一波大模型热潮时,市场对向量数据库的认知还停留在外挂知识库层面。并且此后很长一段时间里,AI的核心价值体现在内容生成——无论是撰写报告还是生成代码,本质上都是对用户指令的被动响应。

彼时,企业将向量数据库视为解决大模型幻觉、扩展私有知识的“补丁工具”,典型的应用场景是RAG(检索增强生成)——将企业文档向量化后存入数据库,用户提问时检索相关片段喂给LLM生成答案。这是一个被动、静态、低频的调用模式。

但Agentic AI的出现彻底改变了这一逻辑,其核心特征是自主目标驱动:能够理解复杂需求、拆分任务流程、调用外部工具、实时调整策略,最终完成端到端的复杂任务。

据Gartner预测,到2028年,支持生成式AI的数据库支出将达2180亿美元,占市场74%。但MIT研究显示,超95%的企业AI项目因多模态数据割裂、系统链路冗长、权限管理复杂难以落地。

“Agentic AI的爆发,正在颠覆数据库行业的底层逻辑。”Zilliz解决方案总监沈亮直言,“当AI从‘被动响应工具’进化为‘主动决策主体’,传统数据库的短板被无限放大,而向量数据库正成为这场变革中不可或缺的核心基础设施。”作为全球首个向量数据库企业、开源向量数据库Milvus的创造者,Zilliz见证并推动了向量数据库从技术概念走向商业规模的全过程。


Zilliz解决方案总监沈亮

“在AI从被动到主动转变的过程中,也将数据库推向了AI决策的核心一环。”沈亮表示。

Agentic AI所需要具备的自主规划、工具调用、持续学习、多轮记忆的核心特征,对底层数据库提出了四类刚性需求:

首先是对读写性能的要求进一步提升。传统RAG场景以读为主,知识库更新周期可能是天甚至周。但Agent在单次任务中就可能产生数十次读写操作:检索经验记忆(读)、写入行动日志(写)、更新用户画像(写)、查询工具链(读)。沈亮指出:“Agent调用记忆模块的频次、数据更新速度,不光要读,很多时候还要去写,这对数据库的读写性能要求比传统RAG高很多。”所以长期以来,Milvus针对高性能读写做了大量优化。

第二是,与传统数据库的“千人一面”(数据信息是固定的,每次查询得到的信息也是固定的)相比,Agent为每个用户生成的记忆是“千人千面”:行为轨迹、偏好向量、反馈记录都需要独立存储。“千万用户乘以个性化数据,向量数据动辄就是百亿量级。业界能比较好处理这么大体量数据的向量数据库非常少。”沈亮测算道,“而Milvus以及其商业版的Zilliz Cloud是为数不多能解决这个问题的产品。”

第三是,成本与性能之间要实现平衡。Agent应用商业化早期ROI低,企业对价格极度敏感,如果将全部向量数据全部采用内存存储,带来高昂的成本,令企业无法接受。这就要求数据库具备智能化的数据生命周期管理——热数据高性能访问,冷数据低成本存档。针对这一背景Milvus推出了内存-磁盘-对象存储的多层存储方案来解决这个问题。

第四是,从单一模态到多模态融合处理能力的提升。对于Agentic AI而言,多模态交互已经是必选项,Agent需同时理解文本、图像、地理位置、用户行为等多种信号。这就对数据库提出了能够同时处理语音向量、图像向量,并实现跨模态的关联检索的要求。传统数据库的单模态精确匹配,无法支撑多向量列联合召回的复杂场景。而Milvus自2.4版本开始,就已经开始了对多向量列+各种标量数据的探索,迄今为止,已经积累了稠密向量、稀疏向量、二值型向量等向量类型数据(可广泛表示各种多模态数据),以及地理位置、标签、时间日期等标量类型数据的支持。

落到具体场景中,以电商智能客服为例,传统AI客服仅能根据关键词匹配预设答案,而Agentic AI客服则能自主查询用户历史订单、当前商品库存、物流信息,甚至结合促销规则为用户制定个性化购买方案,甚至还需要具备一些图片识别、语音/语义识别的能力。这个过程中,AI需要在毫秒级内完成海量非结构化数据的检索与关联,传统数据库根本无法承载。

向量数据库是“决策中枢”的底层逻辑

在应对这些挑战的过程中,向量数据库正转变为企业应用Agentic AI的必选项。

向量数据库的核心价值不在于存储,而在于高效检索“语义相似性”。众所周知,传统数据库(如MySQL、PostgreSQL)主要面向结构化数据需求,擅长处理结构化数据的精确匹配,但却无法满足生成式AI对海量非结构化数据的存储、管理以及语义检索需求。

而向量数据库处理的是非结构化或半结构化数据(文本、图像、音频)经过深度学习模型编码后生成的高维向量(通常数百到数千维)。其核心查询是:找出和这个向量最相似的Top-K个向量。

与此同时,作为LLM的记忆体,向量数据库以极具性价比的形式为其提供存储功能,在减少大模型开发成本的同时,也能极大提高LLM的性能。另外,对于那些对数据隐私有需求,不希望将本地数据上传大模型的企业来说,向量数据库也是它们存储和管理企业知识的不二选择。

对此,沈亮表示:“Agent需要记录短期历史、长期经验、工具调用效果,这些数据与传统知识库差别非常大。向量数据库从被动工具变成了主动、灵活、高频访问的核心组件。”

具体而言,向量数据库为Agentic AI提供四大不可替代的价值:

价值一,构建可扩展的认知记忆。 通过向量化存储,Agent的每次交互、每个决策都被编码为高维空间中的点。Milvus的分布式架构支持百亿级向量存储,配合冷热分层,让“记忆”既有容量又有速度。这相当于给Agent构建了一个可无限扩展的“数字海马体”。

价值二,实现低延迟的经验检索。当Agent遇到新问题,需在毫秒级从海量记忆中找到最相关经验。Zilliz Cloud的AutoIndex技术使查询性能提升3-5倍,某电商客户图搜场景实现<30毫秒响应。这种速度是Agent保持"思维流畅性"的前提。

价值三,支撑多Agent的集体协作。复杂任务需多Agent协同,向量数据库作为中央知识枢纽,存储各Agent的中间结果与共识知识。

价值四,降低AI落地的信任门槛。通过BYOC方案,企业可将数据保存在自有VPC中,满足GDPR、HIPAA等合规要求。这是金融、医疗、自动驾驶等领域采用Agentic AI的前提。

沈亮指出Agentic AI与传统RAG不同,对向量数据库底层数据库特性有要求。“性能上,读写频次和数据更新速度要求高,公司采用读写分离架构,避免读写相互影响,而部分友商产品存在读写相互折损问题。”

Zilliz一直把自己定位在AI Infra层,将向量数据库作为连接大模型与垂直场景的关键齿轮。而且与其他数据库服务商专注于做闭源产品不同的是,Zilliz选择了开源Milvus与闭源Zilliz Cloud“双管齐下”的商业模式,而且开源产品Milvus作为起家产品,其能力已经在多个行业应用中得到了认可。

比如,在HR领域,智联招聘与Milvus合作,采用向量召回技术提升招聘匹配效率。通过双塔模型结构处理JD和CV文本信息,映射为低维向量,利用对比学习优化匹配精度。使用Milvus进行向量数据库管理,通过体感评估和量化指标评估模型表现,解决人力线索评估的难题;在传媒领域,搜狐新闻利用Milvus分布式向量检索引擎,提升了个性化新闻推荐系统的性能,包括向量检索速度提升10倍,新闻分类准确率提高至95%,并减少了内存占用。这使得搜狐新闻能够更快响应用户需求,降低成本,并提升用户体验。

沈亮介绍道,一方面,Zilliz通过开源的Milvus向量数据库搭建起了开源开放的数据库社区,吸纳更多的用户和企业,让他们对向量数据库有了更为深刻的了解,通过开源的产品,Zilliz也可以从用户那里及时获得新需求,从而“反哺”商业化产品Zilliz Cloud,让更多人了解Zilliz。

另一方面,当使用Milvus产品的用户在业务上有进一步需求的时候,因为对Zilliz的能力已经有了初步的了解,在寻求进一步服务的过程中,选择Zilliz商业化产品——Zilliz Cloud的可能性也会更大,沈亮指出,“Milvus与Zilliz Cloud完全接口兼容,企业可以根据自身需求灵活选择,很多客户先通过开源版验证技术可行性,再平滑迁移至商业版,迁移成本几乎为零,分钟级即可完成切换。”

当开源用户规模达到临界点,运维复杂度、性能瓶颈、成本压力会促使它们转向商业版。“我们有相当多的商业化用户是从开源转来的,”沈亮举例,“某头部电商早期用Milvus搭建向量检索平台,支撑图搜、推荐、风控等场景。但到了双十一,他们意识到自建方案在稳定性、性能调优上存在瓶颈,最终整个集群切换到Zilliz Cloud。”

与云协同,铺设通往通用智能的“记忆高速路”

向量数据库的性能发挥高度依赖底层基础设施的弹性与扩展性,而云原生架构恰好提供了这样的能力。有报告显示,2024年全球云DBMS收入占比已达64%(766亿美元),贡献了89%的市场增量,包含亚马逊云科技等在内的头部服务商垄断了76%的云数据库市场份额。这一数据表明,云已成为数据库的主流部署环境。

正是看到了云原生的巨大优势,Zilliz自2021年起便与亚马逊云科技展开合作,目前已成为亚马逊云科技最高等级的第三方合作伙伴,双方的合作从技术适配、产品集成延伸至市场推广、客户服务等多个层面,形成了深度绑定的战略关系。“与亚马逊云科技的合作不是简单的产品集成,而是从底层技术到上层生态的全方位协同。”沈亮如是说。

在资源配置方面,基于Amazon Elastic Compute Cloud(Amazon EC2)丰富的实例类型,Zilliz Cloud提供了包括性能型、容量型、存储扩展型等多套深度优化的解决方案,满足用户不同的负载需求。

在弹性架构方面,Zilliz基于Amazon Elastic Kubernetes Service(EKS)的容器化自动扩缩容能力,可动态应对流量高峰,确保用户业务量激增时AI应用的稳定高效运行。

在成本优化方面,Zilliz Cloud还适配了支持Amazon Graviton处理器的实例,可将成本优化提升20%以上,并显著提升性能。

具体来看,选择Zilliz Cloud向量数据库解决方案构建各种AI应用的客户,也利用亚马逊云科技在模型服务层的优势,通过灵活的API接口,在Amazon Bedrock上调用领先的大语言模型和嵌入模型,做快速选择、切换和调用,并进一步大幅简化数据处理流程,释放数据深层价值。

此外,Zilliz应用生成式AI助手Amazon Q帮助技术团队更快熟悉亚马逊云科技的服务,简化信息访问、加强信息检索与优化配置,相比直接阅读产品文档,可为技术人员节省50%以上的检索时间。

商业层面,亚马逊云科技 Marketplace为Zilliz导入大量用户,更重要的是,这些用户中相当一部分是国内AI出海企业。“他们在美国、日本、新加坡做创新应用,最关心应用开发周期,试错成本要低。”沈亮分析,“我们的向量数据库+亚马逊云科技的AI生态,让他们创新周期大大缩短。”

Zilliz与亚马逊云科技的合作不仅是“单方面的胜利”,而是双方相互成就。除了亚马逊云科技为Zilliz的向量数据库提供了稳定的云环境、模型服务层优势,以及出海的支撑之外,Zilliz Cloud的高性能向量搜索能力也为亚马逊云科技企业客户带来了显著的商业影响。凭借在数十亿向量中进行低于10毫秒延迟的搜索以及严格的合规性,组织可以以前所未有的规模实施AI应用。“很多用户最初只用Milvus开源版,我们引导他们使用亚马逊云科技的服务后,他们会更多使用SageMaker、Bedrock等AI产品,为亚马逊云科技带来新用户。”沈亮如是说。这种共生关系,使双方从“供应商-客户”升级为“生态伙伴”。

“通过选择在亚马逊云科技上使用Zilliz Cloud,组织可以自信地扩展其向量搜索操作,并专注于创新,而非基础设施管理。”沈亮指出。例如,美国顶级的法律AI SaaS公司Filevine使用Zilliz Cloud使海量法律文档可快速搜索,将研究时间从数小时缩短至数分钟。这一改进得益于Zilliz Cloud对其自研向量数据库内核Cardinal的 10倍的性能提升(相较开源Milvus)以及自动索引AutoIndex优化等功能。

当前,对于企业而言,选择合适的向量数据库与云平台,构建AI原生的数据架构,已成为把握Agentic AI机遇的关键。回看Ziiliz的来时之路,在数据库的“战场”上,Zilliz抓住了AI带来的机遇,实现了“长期主义者”的突围。Zilliz用7年时间证明,在AI时代,数据库不再是幕后存储,而是智能体认知的“第一性原理”。

从十亿向量到千亿向量,从单模态到万模态,从静态知识到动态认知,向量数据库的演进,本质上是在为AI铺设一条条通往通用智能的“记忆高速路”。而Zilliz已成为这条公路上最坚定的筑路者。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。