当前位置：首页 » 资讯 » 新科技 » 正文

中国联通提出新框架MeanCache，刷新多模态生成模型推理加速基准

IP属地中国·北京 机器之心Pro 时间：2026-04-01 16:41:30

作者和团队介绍：本文第一作者是高焕霖，通讯作者为赵放和廉士国，所有作者均来自联通数据智能有限公司（中国联通数据科学与人工智能研究院）- 元景大模型研发团队和南京大学，专注于联通元景大模型研发。
FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存（Feature Caching）方案在追求高倍率加速时，常因瞬时速度的剧烈波动导致轨迹漂移。
针对这一痛点，中国联通数据科学与人工智能研究院与南京大学研究团队，在此前工作 LeMiCa（NeurIPS 2025 Spotlight）的基础上继续深耕，推出了进阶加速框架MeanCache
该工作不仅承袭了团队在扩散模型加速领域的深厚积淀，更在技术上实现了跨越：受到 MeanFlow 启发，MeanCache 首次将 “平均速度” 视角引入缓存推理，通过 JVP 修正精准校正了生成轨迹，实现了4x以上的推理提速。该成果已入选人工智能顶会ICLR 2026，目前，论文、代码均已开源。

论文标题：MeanCache: From Instantaneous to Average Velocity for Accelerating Flow Matching Inference论文链接：https://arxiv.org/pdf/2601.19961项目主页：https://unicomai.github.io/MeanCache/代码地址：https://github.com/UnicomAI/MeanCache
技术创新：平均速度驱动的缓存新范式
MeanCache 的核心贡献在于将缓存加速从 “瞬时速度” 转向了 “平均速度”，主要包含以下两个核心技术点：
JVP 驱动的平均速度

该建模方式将缓存视角从单一的 “点” 扩展到了 “区间”，通过提供更稳定的引导信号，有效地校正了高倍率加速下的轨迹偏离。

轨迹稳定调度策略
“什么时候该缓存？” 以往的方法多依赖固定步长或手动阈值。MeanCache 将推理过程建模为一个多重图（Multigraph）寻优问题。
它将每个时间步视为节点，将预测均值速度与真实值之间的稳定性偏差定义为边权：

节点和边组成多重图，然后再通过峰值抑制最短路径（Peak-Suppressed Shortest Path）算法，在给定的计算预算下，计算规则下最优的缓存策略：

实验结果：刷新 SOTA 加速表现
文生图
在商业级文生图模型 Qwen-Image 和 FLUX.1 [dev] 分别实现最高 4x 加速，在 Image Reward 和感知指标上取得了 SOTA 的表现。

从视觉效果上看，随着加速比的增大，MeanCache 生成的图片在内容一致性方面表现更好。

文生视频
在视频生成模型 HunyuanVideo 上也实现了 3.6x 加速和 SOTA 的指标提升。

在对视频的定性分析上，MeanCache 也表现出更好的加速效果，不论是画质还是内容一致性方面。

语义一致性：更进一步，针对 rare-word（如下图 "Peristeronic"）的高难度生僻 prompt 的测试下，MeanCache 展现了更强的语义鲁棒性。

业界顶级团队推荐
同时，MeanCache 已支持最新的阿里通义 Z-Image 和 Qwen-Image-2512 文生图模型，并获得了 Z-Image 团队的官方主页推荐，社区已支持ComfyUI

总结与展望
MeanCache 作为一种轻量化、免训练的 Flow Matching 加速框架，创新性地提出了 “平均速度缓存” 与 “轨迹稳定性调度” 方案。该方案在确保图像高保真度与内容一致性的基础上，显著提升了大模型的推理效率。联通元景大模型团队将以此为基石，持续深耕模型推理加速及复杂场景生成领域。我们致力于为业界贡献更多元化的技术视角，进一步降低工业级生成模型的使用门槛与算力成本。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用