当前位置: 首页 » 资讯 » 新科技 » 正文

养虾省91%词元!这家AI记忆公司用1亿个多模态文件验证了!

IP属地 中国·北京 机器之心Pro 时间:2026-03-25 17:56:53



机器之心发布

一家企业花了七周时间部署 AI:第 1 周精准回答行业分析问题,团队欢呼;第 3 周反复回答相同的错误结论,因为它“忘了”上周的修正;第 5 周在董事会汇报中引用了已被否定的数据,造成决策偏差;第 7 周项目暂停,“AI 不可信”成为共识。问题不在于 AI 不够聪明,而在于它每次醒来都是一张白纸。

AI 领域正在发生根本性转变:瓶颈不再是模型智能,而是记忆架构

在数百个 AI 生产部署中,行业专业人士观察到一种普遍模式:最优秀的模型在落地中失败,不是因为缺乏推理能力,而是因为缺乏连续性、上下文积累和自学习能力。用户重复输入信息,客服智能体凭空捏造过时数据,成本飙升,参与度下降 ——“哇” 的惊喜瞬间被挫败感取代。

长期记忆,是 AI 从无状态计算转变为有状态智能所缺失的基础架构层 —— 而且,它将成为 AI 技术栈中最坚固的护城河。

01 记忆是新的护城河

状态 > 模型

大多数前沿模型和智能体 ——OpenAI、Claude、LangGraph、CrewAI 等 —— 在设计上都是无状态的。每次新会话或聊天重置,都让 AI 回到 “初生状态”。2026 年初,以 “龙虾”(OpenClaw)为代表的开源智能体社区,正在积极探索 AI 的持久化记忆。但在生产级场景,社区开发者普遍发现,基于文件系统的记忆方案在复杂推理和跨设备同步上逐渐遇到瓶颈:

缺乏智能压缩 → 记忆越多,token 越贵,成本飙升不考虑时间因素 → 事实不会随生活变化而演变或失效不具备可移植性 → 记忆被限制在单个设备或单个智能体上缺乏企业级检索能力 → 扩展到数千用户或复杂工作流程时直接崩溃

与此同时,GPT-5、Claude、Gemini 正在商品化。模型性能差距缩小,API 成本大幅下降(GPT-4 价格比发布时便宜 97%),微调触手可及,开源方案加速发展。但状态是永久性的。通过互动、决策、工作流程和结果积累的认知记忆创造复利价值 —— 这是任何模型替换都无法复制的。

行业共识正在形成:记忆,是 AI 技术栈中新的护城河

02 真正的记忆生产力

从婴儿到大学生

当前大家沉迷于 “养龙虾”,养的大多是用户偏好记忆,几个 MB 就装下了。但你的 AI,仍然是个婴儿。

为什么?因为当前绝大多数 AI 平台的 “记忆功能”,本质都是一样的:存储用户偏好

ChatGPT 的 “记忆”:记住了你说过 “我住在北京”。好,下次推荐天气时用上。Claude 的 “Projects”:把文件塞进项目上下文,会话结束后就散了。各种 AI 的 “长期记忆” 插件:本质上就是一个键值对数据库,存的是 “事实片段”。

这是记忆的起点,而不是终点。

RAG、向量数据库、长上下文 —— 这些现有方案分别解决了不同层面的问题。RAG 解决了 “让 AI 看到外部文档” 的数据接入问题;向量数据库为语义检索提供了存储基础;长上下文窗口让 AI 能够 “一次性看更多信息”。它们是记忆基础设施的重要组成部分,但单独使用任何一个,都无法构建完整的记忆系统。

记忆 = 理解 + 存储 + 组织 + 推理 + 遗忘 + 演进

如果说 RAG 和向量数据库是 “图书馆”,长上下文是 “更大的阅览室”,那么真正的记忆系统应该是 “大脑”—— 它不仅能查阅资料,还能将每次阅读、每次对话、每次决策内化为可复用的认知记忆。

真正的记忆生产力,让 AI 从大学生开始养成:有自己的知识体系(开放专业数据),能判断信息来源是否可靠(溯源),面对矛盾信息会思考、会判断(冲突解决),能看懂你的图表、听懂你的录音视频(多模态处理),能把每一次交互都沉淀为可复用的能力(反思记忆),而不是一句 “用户喜欢深色模式”。

03 “AI 记忆护照”

让 AI 世界永久记得你

另外一个关键问题 ——记忆的可移植性。传统 AI 系统的问题在于,你在 ChatGPT 里告诉它的偏好,在 Claude 中无法使用;你在 Telegram 里积累的对话历史,在 Slack 中需要重新开始。每个 AI 都是孤岛,每次切换都意味着 “失忆”。

质变科技采用 “一个记忆护照,通行所有 AI” 的方案,解决这一根本性难题。就像护照让你在不同国家无需重新证明身份,MemoryLake 让你的记忆在不同 AI 平台(OpenClaw、ChatGPT、Claude、Qwen 等)之间无缝迁移。



近日,质变科技推出了首个多模态 AI 记忆平台 MemoryLake 龙虾版(https://memorylake.ai/),面向 OpenClaw 提供永久、可迁移、认知积累的多模态记忆。

MemoryLake 为龙虾等智能体注入的记忆能力,可以归纳为六种类型,构建了完整的认知记忆体系:

背景记忆:那些永不改变的东西 —— 你的价值观、世界观模型,由你手动设定,只读。对话记忆:每一次对话,经压缩后可搜索。没有任何内容丢失。事件记忆:你的时间线 —— 发生了什么、何时发生、顺序如何,构建你的人生叙事。事实记忆:一切可验证的信息 —— 自动检测冲突、版本化、可溯源至来源。当来自不同 AI 的信息矛盾时,系统会实时检测冲突,并按预设策略自动解决。反思记忆:你的 AI 注意到的深层模式 —— 你如何思考、如何决策。技能记忆:你构建一次的方法 —— 在任何 AI、任何会话中永久复用。这实际上是把 “提示词工程” 升级成了 “能力资产”。

为什么这很重要?

当你问:“我在这种情况下优先考虑什么?”—— AI 调用你的价值排序(反思记忆)。

当你问:“上周我们讨论了什么?”——AI 检索事件和对话记忆。

当你问:“这个项目的风险在哪?”——AI 综合事实、事件和反思记忆进行推理。

这种分类让 AI 能像人脑一样,根据问题场景精准定位相关类型记忆,而不是在海量聊天记录中盲目搜索。

用户的体验印证了这种设计的价值:“当我的工作平台从 Telegram 迁移到 Claude Code 时,AI 居然还记得我三个月前提到的一个项目细节 —— 那种感觉就像它真的‘认识’我。”

04 核心技术

让记忆可信、可溯、可冲突解决

龙虾用户的真实反馈揭示了一个更深层的需求:当用户说“希望它能一直记得我”时,他们要求的不是一个功能,而是一种基础设施。MemoryLake 的技术架构围绕 “可信记忆” 基础设施展开,核心能力包括:

1. 智能记忆冲突解决



当来自不同来源或不同时期的记忆相互矛盾时,MemoryLake 会自动检测、标记并解决冲突,同时保留完整的审计轨迹。

MemoryLake 运用时序知识图谱技术以及事实溯源仲裁技术,冲突检测准确率达 95% 以上,时序类冲突自动解决成功率达 90% 以上,支持预设策略(解决策略如最近来源优先、来源优先级、置信度加权)自动解决和人工介入解决。同时保留历史版本和完整的变更链。

例如,在 ChatGPT 中上传了两份报价文件中描述商品 A 报价为 300 美元,而用户切换到 Claude 两小时后对话说 “商品 A 的报价为 330 美元” 系统会自动提示冲突,并给出推荐的解决方案。

2. 完整记忆溯源(Git 式版本控制)



每条记忆节点采用 Content-Addressable Storage 实现版本控制。通过 SHA-256 生成唯一 commit ID,支持分支 / 合并 / 回滚操作,仅存储增量变化。每个事实节点携带完整溯源元数据(来源 AI / 会话 ID / 时间戳 / 置信度 / 父节点引用),通过 append-only 日志 + 链式哈希保证防篡改。你可以追溯任何一条事实的原始来源,跨 AI 会话交叉引用,并导出符合合规要求的完整证明链。

3. 面向隐私保护的安全设计



MemoryLake 将安全设计为架构原点。用户的笔记、文件、健康数据、密码、私人对话 —— 所有这些都全程加密,引入 presidio 等权威 PII 检测模块,实现多模态隐私信息的 100% 检测和屏蔽。 确保与 AI 工具(ChatGPT、Claude、OpenClaw 等)对话中屏蔽安全敏感信息。

4. 开放数据:让 AI 天生 “有见识”



MemoryLake 内置了海量开放数据集:4000 万 + 学术论文、300 万 + SEC 文件、50 万 + 临床试验、实时金融数据、200 万 + 化合物、1000 万 + 美国专利…… 你不需要配置,不需要上传,AI 天生就能访问这些知识。

这相当于为 AI 提供了一个‘博士级的预训练大脑’。当你的私有记忆(如一份内部会议录音)与这些公共知识相遇时,AI 才能做出真正有深度的推理—— 它不仅能听懂你说‘GLP-1 药物’,还能结合最新的临床试验数据,给出超越你认知边界的洞察。这是‘有见识的记忆’。

你问:“给我看看最近关于 GLP-1 药物的临床试验进展。”AI 不是去网上搜(可能搜到垃圾信息),而是直接从内置的 ClinicalTrials.gov 数据集中调用。同时,它会结合你上周在内部会议上讨论的 “公司 GLP-1 仿制药立项计划”,主动提醒你:“根据最新的临床试验数据,该靶点的竞争格局正在发生变化,建议在立项时重点关注差异化的适应症方向。”

5. 多模态记忆:能看懂图表、分析音视频



MemoryLake-D1 是业内首个专注于多模态 “记忆” 理解与结构化提取的领域大模型。基于视觉 + 逻辑双重验证,能处理复杂的 Excel 布局、扫描版 PDF、流程图、会议音视频等。在头部文档办公企业场景中,通用方案的准确率只有 60-70%,而 MemoryLake 实现了 99.8% 的召回率。

这意味着,你的记忆可以来自一次会议录音、一份 PDF 报告、一组 Excel 数据 ——MemoryLake 将它们统一理解、关联、推理。你的 Excel 里的公式逻辑、PDF 里的嵌套表格、会议录音里的关键结论,都会被解析成记忆的一部分。当你在 Claude 里问 “帮我分析一下上个季度的销售数据”,它不仅能看懂你上传的 Excel,还能结合你上个月在 ChatGPT 里讨论的定价策略,以及内置的行业基准数据,给出完整分析。

6. 多粒度记忆隔离与共享



MemoryLake 的多层级记忆设计,让记忆管理达到了新的精细度,通过策略矩阵可灵活控制任意维度记忆共享 / 隔离。常见的组织方式为:

Global 级:全局共享的组织记忆(所有人和 Agent 可读)Agent 级:每个 Agent 的私有记忆(角色定义、专属知识、长期工作物料等)Session 级:每次会话的工作记忆(上下文、短期事实)

以游戏 AI 为例,共享层是基础知识 / 领域知识 / Skill;Global 级是世界观设定(所有 NPC 共享);Agent 级是 NPC 角色记忆(每个 NPC 独立);隔离层是会话记忆 / Agent 私有记忆;Session 级是玩家本次对话上下文(会话结束后压缩入 Agent 记忆)。而这只是其中一种可能的组织方式,MemoryLake 支持记忆共享 / 隔离的灵活配置。

7. 亚秒级多跳推理:记忆会 “自己思考”



最震撼的能力,是 MemoryLake 的记忆不是死的,而是活的。

什么是多跳推理? 举个例子:

你问:“我应该投资这个医疗 AI 项目吗?”

第 1 跳:检索 “医疗 AI 项目” 相关记忆 → 找到:“当前评估项目:斯坦福团队,2 亿估值,5 家医院试点”第 2 跳:关联 “你的其他医疗投资” → 找到:“18 个月前投资 XYZ 公司,同样医疗 AI 赛道” → 提取教训:“XYZ 项目因 FDA 审批延迟导致融资困难”第 3 跳:关联 “你的投资偏好” → 找到:“你倾向技术壁垒强、有专利保护的项目” → 找到:“你对监管风险敏感”第 4 跳:关联 “外部知识” → 从行业报告记忆中提取:“医疗 AI 的 FDA 审批平均周期 18-24 个月” → 从新闻记忆中提取:“斯坦福团队成员中有前 FDA 顾问”

综合输出:“建议谨慎乐观。优势:(1) 团队有 FDA 资源,可能加速审批;(2) 试点医院增速 67% 显示 PMF 良好;(3) 符合你的‘技术壁垒优先’偏好。风险:(1) 参考 XYZ 项目经验,需重点尽调 FDA 进度;(2) 估值 2 亿偏高,建议压价到 1.5-1.8 亿。建议:进入下一轮尽调,重点关注专利组合和临床数据。”

这不是简单的关键词匹配,而是基于记忆图谱的因果推理。



在全球极具挑战性的长程对话记忆基准测试 LoCoMo 上(需在平均 300 轮、跨数月、多模态内容的超长对话中进行精准信息整合与推理),MemoryLake 以 94.03% 的综合得分位列全球第一,显著超越其他记忆方案及人类标注基线。

05 性能为王

生产级记忆基础设施

MemoryLake 的性能指标,为其生产级记忆基础设施能力提供了支撑:

Token 成本直降 91%

MemoryLake 的核心价值之一,就是把 “长期记忆” 从粗暴堆 Token,变成智能提取、结构化组织和按需召回。它返回给模型的不是冗长原文,而是经过理解、压缩和关联后的高价值记忆片段,在生产场景,MemoryLake 最高可实现 91% 的 Token 成本下降,让长期记忆第一次真正具备大规模落地的经济性。

记忆准确召回率 99.8%

MemoryLake-D1 是专门面向多模态记忆理解与结构化提取的领域模型,擅长从文档、表格、图片、音视频、数据库记录和对话历史中抽取关键信息,并将其转化为可计算的记忆单元。再结合时序感知、知识图谱、多跳检索和先进召回机制,MemoryLake 在关键任务场景中可实现 99% 以上的信息准确率,在某些严苛办公场景的端到端评测中甚至达到 99.8%。这意味着它不仅 “记得住”,更能 “记得对”。

无限记忆

MemoryLake 的设计逻辑不是模仿人脑的有限容量,而是利用外部系统的分布式存储与计算能力,把长期记忆真正做成可扩展基础设施。它支持 PB 级记忆容量。也就是说,OpenClaw 专享版所获得的不是 “更大的上下文窗口”,而是一套可以随着用户、组织和业务持续增长的外部记忆系统。它不会因为会话变长而 “遗忘”,也不会因为模型切换而清空,而是像数字世界里的长期资产一样不断积累。

毫秒级延迟

很多记忆系统的问题在于,随着记忆越来越多,召回和推理速度越来越慢,最终拖垮对话体验。面向在线交互,MemoryLake 检索层支持亚秒级的多跳推理查询和跨概念关联查找,底层多模态数据平台已经在超大规模生产环境中实现毫秒级检索延迟。对于龙虾这样的智能体而言,这一点非常关键,因为只有记忆调用足够快,历史上下文才能在对话中 “自然出现”,而不是让用户等待一个迟到的答案。

06 一个真实的场景

从 “文件式记忆” 到 “认知级记忆”

让我们用一个风险投资决策的例子,来具象化这种体验差异:

使用传统 AI 方案

第一周,你告诉 AI“正在评估一个医疗 AI 项目,团队来自斯坦福,已有 3 家医院试点,估值 2 亿美元”。它把这些信息存进 “聊天记录”。第二周,你说 “继续上周的医疗 AI 项目分析”。它会去翻 “历史对话”—— 但翻出来的可能是零散的片段:几条聊天记录、几个关键词、一堆无关的上下文。它需要你补充:“估值还是 2 亿吗?”“团队背景是什么?”“试点医院有哪些?”第三周,当你需要生成投资备忘录时,它可能已经 “失忆”—— 因为中间夹了太多其他项目的对话,关键信息被淹没。你不得不从头梳理。

接入 MemoryLake 的 AI

第一周,你告诉它一次。D1 模型自动提取关键信息:

背景记忆:项目类别(医疗 AI)、估值(2 亿美元)事实记忆:团队背景(斯坦福)、试点数量(3 家医院)事件记忆:首次接触时间、初步评估结论

全部转化为结构化的 “认知记忆”,存入 Relyt 数据平台。

第二周,你说 “继续上周的医疗 AI 项目分析”。记忆引擎瞬间调出完整记忆脉络 —— 不是零散的聊天记录,而是精炼的项目档案:估值、团队、试点、风险点、待办事项。

同时,通过多跳推理,它自动关联:

你三个月前投资的另一个医疗项目(可能存在竞争或协同)你最近阅读的一份医疗 AI 行业报告(补充趋势判断)你的投资偏好(偏好早期 / 成长期、技术壁垒要求等)

第三周,当你讨论新的细节时,它会基于已建立的认知,主动提供有深度的建议:

“根据您之前投资 XYZ 项目的经验,以及您对‘技术壁垒 > 市场规模’的偏好,这个项目的专利布局可能需要重点关注。另外,您在上次医疗投资中提到的‘监管审批周期风险’在这个项目中同样存在。”

这不是简单的信息检索,而是基于全量记忆的认知推理。

07 千亿级赛道

创始人与他的 “记忆引力”

根据 Mordor Intelligence 预测,到 2030 年,全球 AI 智能体编排与记忆系统市场规模将突破 284.5 亿美元,成为 AI 基础设施中增长最快的细分领域。

质变科技抓住了机会。其创始人兼 CEO 占超群(花名离哲),拥有超过十年的阿里云核心数据体系搭建经验,曾主导国内营收最高的云原生数据仓库,并在 TPC-H 和 TPC-DS 两项全球数据库基准测试中同时登顶(中国首次)。

处理几十万亿级别数据的经验,让他比大多数人更早看到 “数据驱动” 的局限,并坚定地转向 “记忆驱动”。早在 2023 年,团队先是通过面向 C 端专业用户的决策智能体 Powerdrill,快速积累了全球超 200 万用户,通过超过 1300 万数据问题修复、5000 万生成代码的调优经验,沉淀出一整套端到端的记忆工程技术,最终产品化为今天的 MemoryLake。

这种扎实积累和快速实践验证,让质变科技在创业初期便收获资本高度青睐,天使轮即获得高瓴创投与光速光合联合投资的数千万美元融资,估值超 2 亿美金。

为什么记忆能成为真正的护城河?

模型的护城河在于算力和数据,而记忆的护城河在于“信任” 与 “中立”。企业不会愿意把积累了数年、涉及核心业务的认知记忆,锁死在一个特定模型厂商的生态里。他们需要一个像 Snowflake 一样、能自由连接任何模型和 AI 的中立记忆层

“记忆是有引力效应的,越用越好用,价值越来越大;模型和智能体可能随需切换,但记忆基础设施是个人和组织需要持续构建的核心资产。” 占超群在谈及公司独立性时表示,“作为全球少有的兼具记忆能力、模型能力和数据平台能力于一体的全栈玩家,我们有机会做出一个像 Databricks、Snowflake 那样的 AI 时代基石企业。MemoryLake 的‘记忆护照’功能,正是瞄准了这一结构性机会 —— 成为 AI 世界里的‘身份与记忆’的通用结算层。”

08 生产可用

头部行业客户验证



在消费领域,MemoryLake 已服务了全球超过 200 万专业数据用户。在企业领域,MemoryLake 服务了超大规模(生产系统中超 10 万亿级记录、亿级文档)的文档办公、头部的企业移动办公应用、大模型、大型国央企等企业,在与全球云大厂和 AI 典型厂商等竞争中,MemoryLake 在成本、准确召回率和延迟等性能指标方面有着数倍于对手的优势,如在某严苛的办公场景端到端评测中达到 99.8 % 准确率。

09 从 “炫酷演示”

到 “关键任务型 AI 伙伴”

当前,记忆领域正围绕不同用户层需求进行有效细分。

但一个清晰的行业趋势正在浮现:记忆是基础设施,而非功能。就像数据库或认证层一样,优秀的智能体会接入中立的记忆平台,而不是重新发明轮子。

所有想要从 “炫酷演示” 转型为 “关键任务型数字伙伴” 的 AI 应用或智能体 —— 包括 OpenClaw—— 最终都将运行在专用的长期记忆层上。该领域的赢家将获得与 Stripe、Plaid 或 Twilio 在其各自层级中相似的平台经济效益:巨大的潜在市场规模、持续的收入,以及通过网络效应和数据飞轮实现的强大防御能力。

模型会像电力一样商品化,但记忆不会。

如果说 2025 年是智能体爆发元年,那么 2026 年就是记忆基础设施的奠基之年。在这场从 “无状态计算” 向 “有状态智能” 的范式迁移中,MemoryLake 押注的不是一个功能,而是一个时代。

而时间,站在有记忆的一边。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。