当前位置: 首页 » 资讯 » 新科技 » 正文

2026,进入AI记忆元年

IP属地 中国·北京 36氪 时间:2026-01-27 19:06:25



让AI像人类一样记忆,
这家公司如何拿下AI竞赛的下半场门票。

前不久,LMArena.ai对全球大模型的市场地位变化做了统计后,得到了一个有意思的发现:

自2023年年中起,SOTA模型的迭代周期被快速压缩至35天,曾经的SOTA模型,只要短短5个月就可能跌出Top5,7个月后连Top10的门槛都摸不到。

但SOTA不断更新的背后,模型的确在进步,但曾经ChatGPT、Deepseek这样让人眼前一亮的新产品却越来越少,技术进步已经进入了不断小修小补却始终难以突破的瓶颈期。

与逐渐偃旗息鼓的模型进化形成鲜明对比的,是过去两年多围绕AI记忆形成的你方唱罢我登场的热闹。

其中,最先一步出发的,是2023年先后涌现出的诸如Milvus、Pinecone、faiss为代表的向量数据库产品。

此后一年,建立在成熟的语义、知识图库以及关键词检索基础上,2024—2025年期间,Letta(MemGPT)、Mem0、MemU、MemOS为代表的各种AI记忆框架,如雨后春笋般冒出,GitHub上各种Mem“X”系产品,多到可以组成连连看。

热闹很快传导至模型玩家阵营,一周前,Claude被爆要在Cowork中为模型增加记忆能力引发的讨论尚未消退,谷歌又紧随其后,宣布了最新的Nested Learning成果,模型会根据上下文推理的结果自动修改参数实现模型记忆,再次引发行业哗然。

而在场景侧,代码补全、情感陪伴、智能客服……模型+记忆的黄金商业模式,市场正诞生出越来越多跑通PMF的细分爆款。顺着这条线,红熊AI在内,一些主打AI记忆科学解决方案商业的玩家,也随之站到了聚光灯下,成为新的行业焦点。

记忆成为新的中场赛点已经无可置疑。但关于如何给大模型加上记忆,如何让模型更好地记忆,或许一直以来,行业都有三个误解。

误解一:
记忆=RAG+长上下文?

红熊AI创始人温德亮是行业老人了,但创业以来,每天都要应对投资人与客户的灵魂拷问:“你们的竞争对手是谁?”

问题看似普通,但回答起来,却会让人陷入两难:说没有对手像自大,说有对手又找不到真正对标的玩家。

在2023—2024年AIinfra爆发期,RAG(检索增强生成)技术一度成了AI记忆的代名词。通过给模型外置一个向量数据库,并存入各种企业的私有数据、专业文献,大模型便能掌握在模型训练阶段没有更新的信息,以及私有数据知识。

在那一时期,投资人看项目必问RAG性能,客户选型必定先比检索准确率,仿佛只要叠加上下文窗口、检索优化算法,AI健忘的痛点就能被尽数解决。

一时之间,全球范围内,做RAG框架的、做RAG解决方案的,以及更深一步做纯私有化知识库部署的团队如过江之鲫。飞书、钉钉、企业微信等巨头可以靠着标准化以及数据沉淀做标准化,中小团队也能靠着私有化部署啃下一个又一个垂直场景。

但在商业中,一个认知的共识程度越高,就说明它越正确,但也越说明这是个滞后变量。

RAG的思路没有错,但也会随着技术的演进而暴露出短板。2024年开始,温德亮发现,传统RAG似乎被大家过度神话了。在落地过程中,有时候即使只是最基础的知识库项目,RAG也能以各种意想不到的姿势撞墙:

比如在法律类项目,经常会出现大量语义相似,但是实际适用范围、判例天差地别的场景。具体来说,法条中,有很多决定适用边界的关键细节(如合同解除需催告程序等),在语义层面权重极低,会被整体相似性掩盖;此外,法律体系的运行不是孤立的文本匹配,需要遵循上位法优于下位法、特别法优于一般法、新法优于旧法等等约束,但面对类似的冲突条款,模型只按语义相似度排序,而非优先匹配效力更高的法条,就会导致整体理解出现偏差。更不用说,法律场景中,检索本身一定是绑定案由、主体、地域等结构化场景信息,比如人身损害赔偿相关法条,可能与适用于交通事故和医疗纠纷的子条款语义相近,但举证责任、赔偿标准截然不同,纯语义检索完全无法精准区分适配场景。

难度再升级,到了各种客服AI场景,即便针对场景做了定制化,把embedding、chunking、ranking全部做到尽善尽美,RAG方案依然会出现:在每天重复回答“XX条款的适用场景是什么”“还款日期如何计算”这类问题时,花费不必要的检索成本;而当用户跨会话咨询时,AI更是像换了个人,完全不记得上一轮的沟通细节。

温德亮很快意识到:基于语义检索的RAG方案只能解决不到60%的真实需求,而客户要的是完整场景化解决方案,能够实现一次咨询、终身记忆,并且动态更新知识。

RAG作为一种被动的检索工具,它的存在就像给AI装了本外置词典,能解决不知道的问题,却解决不了记不住的核心矛盾。与此同时,在写入侧,RAG通常也只能以周为单位做离线的数据更新,无法实时动态地写入用户的即时会话内容与关注重点。

在此基础上,跨会话记忆丢失、信息无法动态沉淀、不会主动关联经验,这些都是RAG的能力盲区。

也是因此,在他看来,真正的AI记忆,必须复刻人脑的工作逻辑,能短期记得住,长期有常识,判断有感情。

具体来说,人脑处理信息要经过编码、存储、提取三大环节:外界信息会经感觉皮层转化为神经信号,由前额叶筛选后传入海马体,再与既有知识网络整合,最终按重要性存入大脑皮层;提取时则由海马体联动对应区域激活记忆。

这是一套动态、实时、可写入可检索的智能系统,不仅解决了知道的问题,也让“知道”本身内化成为认知与思考逻辑的一部分,优化后续的思考、判断与行为。

借鉴这套人脑的记忆-思维逻辑,红熊AI据此打造了完整的记忆科学体系,并在今年1月推出记忆熊v0.2.0,把AI记忆拆解为显性记忆、隐性记忆、联想记忆以及动态进化记忆,不同层之间通过智能算法动态流转、在不同场合以不同的方式使用。

更关键的是,这套体系不止于读、写、存,还为记忆本身加入了情感加权、智能遗忘、跨智能体协同等能力,从底层重构了AI记忆的逻辑。如此一来,不仅解决了存储数据量爆炸,带来成本飙升、上下文过长的问题,也为不同的记忆赋予不同的权重,从而让记忆的利用变得更加高效。

误解二:
事实检索重于一切?
情商才能更好解决问题

解决了整体记忆体系架构如何搭建的问题之后,红熊AI的核心研发团队和所有技术团队一样,开始把准确率当作记忆系统的唯一KPI。

团队里做工程与研发的同事占据多数,其中理工背景的男生又占据了大半,如此配置,最大的优点是大家都有共同话语体系、思维能力强,在金融风控、技术运维等场景,这套逻辑可以跑得非常顺。毕竟,这些场景中,事实优先,错一个数字都可能引发无法预知的风险。

但这么做的不足则在于:不分场合的过度坦诚与逻辑推理,本质上就是冷漠与对抗的代名词。

让所有人意识到这一点的,是一个意外的客户需求。

2025年,某发达省份妇联找到了红熊AI团队,表示他们希望用AI承接深夜情感咨询、家庭纠纷求助。

梳理用户需求时,团队很快发现,那些深夜的来访者,他们的烦恼有时是非常琐碎、具体,却没有标准解决答案的,甚至用户来访时,自己已经有了判断,只是需要一点来自外界的肯定与鼓励。在这种场景中,用户不需要也不存在所谓的精准事实答案,他们需要的是被理解、被安抚、被肯定。比如,新用户来电时,AI要快速识别情绪波动,引导他们情绪的宣泄;老用户回访时,要记得他们上次的困扰以及怎样的安抚最为有效。

总而言之,犯错要先道歉,情感困扰要先赞同理解共情,这些人类处事的情商准则,AI落地也同样需要熟练掌握。

这也倒逼红熊AI攻克了记忆系统的情感难题:

通过给每段记忆贴上情感权重标签,可以从多维度量化用户情绪。比如,文本场景中,我们可以通过负面/正面词汇密度、句式(反问句、感叹句)、情绪强度词(“极其”“再也不”)综合算出0-100分的情感分数;语音场景中,则需要叠加语速、语调、停顿、音量特征校准;多模态场景,还可以再加入面部表情识别,让量化更精准。

就如同朋友失恋了,我们需要先给对方一个拥抱,而不是追根究底分手原因做情感判官。对AI落地来说,情感权重不仅会决定记忆的优先级,更影响AI的回应逻辑。比如在红熊AI的产品中,如果用户上个月因物流延迟给出90分负面评价,那么这段记忆需要被存入长期记忆并贴上高负面标签。当用户本月再次询问货什么时候到,AI不能只机械回复物流在途,而是先安抚“抱歉之前让你等久了,我帮你查了实时物流,马上就能到”,再同步事实信息。

误解三:
Agent的未来是标准化?
非标才是行业宿命

今年年初,Manus的爆火与并购进度,一度让整个Agent赛道陷入狂欢。一时之间,复刻下一个Manus,做to B的Manus,成为了行业最热门的议题。

资本在等待超级Agent的诞生,用户也期待用一套产品,解决不同场景中的所有问题。但在大厂打过工,又在SaaS公司做过CTO,如今在自己创业的温德亮脑海中一直有一个问号:agent的市场盘子的确很大,但真的能出现所谓的超级赢家吗?

或许一个有些扫兴的结论是,agent类产品的宿命,在革命SaaS,但也必须走上SaaS的老路。

革命SaaS的逻辑在于:记忆与工具的加持,让Agent开发门槛大幅降低,从而针对每一个特殊场景提出针对性的解决方案,进而瓦解传统SaaS的场景壁垒。

而与这种无限细分的天然优势相伴随的,必定是传统中国SaaS的非标碎片化诅咒。在实际开发中,温德亮意识到,没有一套标准化记忆系统能适配所有行业,甚至同一行业的不同品类都要差异化定制。哪怕都是电商销售百货,卖手机壳的商家和卖手套的商家,前者关注材质、图案,后者侧重尺码、舒适度,关键词不同,记忆规则的制定也要有所区别。

到了情商的使用与落地,不同行业的情感权重占比更是天差地别。红熊AI摸索出一套行业规则:售后客服、教育场景情感权重占40%—50%,必须优先安抚情绪;医疗、金融风控场景情商的需求仅占10%—20%,事实优先;通用陪伴场景占20%—30%,贴合心情即可。这都需要漫长的行业摸索。

在这一背景下,红熊AI必须在做好标准化能力的基础上,接受在解决方案环节的非标、苦生意的宿命,

首先是共性能力建设。

尽管,不同客户的数据来源、数据处理流程,以及对记忆的需求模式不尽相同,但行业的长期趋势是多agent协作、大模型将越来越多地利用起企业的多模态数据,这却是共同的大趋势。

也是因此,在记忆熊v0.2.0中,红熊AI强化了其集群化Agent记忆协同能力,通过引入统一记忆中枢(Memory Hub),可以实现多Agent间的最小化、按需式记忆共享,解决传统多Agent系统的记忆冗余、冲突问题。并同时支持主管模式(集中管控流水线任务)和协作模式(去中心化复杂决策),适配不同场景的智能体组织形态。

而针对多模态数据的处理需求,在知识库层面,红熊AI则推出了三大解析引擎(DeepDoc深度解析、MinerU智能提取、TextIn快速解析)实现100%版面还原,支持PPTX高保真解析、音视频以文搜音,并通过向量+图谱双驱动检索,将多跳推理准确率提升至92.5%。



基于以上共性的能力建设,非标的环节,则集中于行业词汇库积累、知识图谱打造这样的行业解决方案打造。

红熊AI旗下记忆熊的产品设计结构,我们可以理解为,产品顶层是一个由小模型不断根据用户输入做动态调整的类似graph的知识图谱结构,类似导航图,向下则是不同的数据库组成的记忆管理模块。

其中顶层的graph打造,是一个需要一个细分行业一个细分行业去硬啃的过程。首次拓展新的品类客户,前期与客户共建,做文档以及知识梳理就需要花掉几周的时间,此后,用户的数据处理,也需要消耗整体25%上下的成本。



在这个过程中,也需要团队去不断学习与积累不同行业的知识:比如医疗行业的负面词不是“不满意”,而是“疼痛、过敏、并发症”;金融行业的核心词是“平仓、建仓、净值”,需优先记忆;制造业的“故障、停机”则要强制存入长期记忆。

但另一个角度来看,这种前期开拓的非标准化以及缓慢,又会成为企业先发优势的由来。

过去十多年中,SaaS的成长路径,往往遵循一个细分领域拿下灯塔客户-沉淀出细分行业解决方案-全行业拓展的规律,其标准化程度虽然远不及互联网,但企业的核心壁垒也正是在于这种细分行业认知的沉淀。

针对不同行业的记忆打造同样如此,有了前期解决方案的不断细分,才会有后来的生态效应与know how积累。

尾声

进入2026年,大模型的叙事,正从scaling law为核心的参数闪电战,切换至记忆为主导的马拉松式下半场。

而在大模型的下半场,记忆能力已经成为拉开不同模型,不同agent表现的核心来源。围绕这一套叙事逻辑,参与的玩家,既有模型厂、框架玩家这样的上游infra玩家,也有红熊AI在内这样的专业解决方案商。

这个过程,不如曾经的百模大战一样的高举高打,也注定不会像百模大战一样快速地决出阶段性的赢家,给出所谓的标准答案。

但动物有了个体的记忆,才会有更好的生存;人类有了族群的记忆才有了文明;而记忆之于AI,或许正是新一轮产业进化的起点。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。