当前位置：首页 » 资讯 » 新科技 » 正文

港大携手快手可灵突破长视频一致性瓶颈，"记忆检索"技术震撼发布

IP属地中国·北京 编辑：任飞扬 Chinaz 时间：2025-08-26 16:21:13

AIbase报道香港大学与快手可灵团队近日联合发表重磅论文《Context as Memory: Scene-Consistent Interactive Long Video Generation with Memory Retrieval》，提出革命性的"Context-as-Memory"方法，成功解决长视频生成中场景一致性控制的核心难题。
创新理念:将历史上下文作为"记忆"载体
该研究的核心创新在于将历史生成的上下文视为"记忆"，通过context learning技术学习上下文条件，实现长视频前后场景的高度一致性控制。研究团队发现，视频生成模型能够隐式学习视频数据中的3D先验，无需显式3D建模辅助，这一理念与谷歌Genie3不谋而合。
技术突破:FOV记忆检索机制大幅提升效率
为解决历史帧序列理论上可无限延长带来的计算负担，研究团队提出基于相机轨迹视场（FOV）的记忆检索机制。该机制能从全部历史帧中智能筛选出与当前生成视频高度相关的帧作为记忆条件，显著提升计算效率并降低训练成本。
通过动态检索策略，系统根据相机轨迹FOV重叠关系判断预测帧与历史帧的关联度，大幅减少需要学习的上下文数量，实现模型训练和推理效率的质的飞跃。
数据构建与应用场景
研究团队基于Unreal Engine5收集了多样化场景、带有精确相机轨迹标注的长视频数据集，为技术验证提供坚实基础。用户仅需提供一张初始图像，即可沿设定相机轨迹自由探索生成的虚拟世界。
性能表现超越现有方法
实验结果显示，Context-as-Memory在几十秒时间尺度下保持出色的静态场景记忆力，并在不同场景中展现良好泛化性。与现有SOTA方法对比，该技术在长视频生成场景记忆力方面实现显著性能提升，且能在未见过的开放域场景中有效保持记忆连续性。
此次突破标志着AI视频生成技术向着更长时序、更高一致性的方向迈出重要一步，为虚拟世界构建、影视制作等应用领域开辟新的可能性。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

开口前先考虑“这话合规吗”，直播电商新规将施行

iPhone Fold配备5500mAh电池：苹果手机史上最大电量

天玑9600 9月亮相：联发科首款2nm芯片对标苹果A20

东风奕派全面接入“华为全家桶”

独立自主国产操作系统AI智能化生态创新成果发布

小米汽车全国已有484家门店

全站最新

开口前先考虑“这话合规吗”，直播电商新规将施行

iPhone Fold配备5500mAh电池：苹果手机史上最大电量

天玑9600 9月亮相：联发科首款2nm芯片对标苹果A20

东风奕派全面接入“华为全家桶”

热门推荐

小米SU7 Ultra月销量跌至45辆

开口前先考虑“这话合规吗”，直播电商新规将施行

iPhone Fold配备5500mAh电池：苹果手机史上最大电量

天玑9600 9月亮相：联发科首款2nm芯片对标苹果A20

符号化生存之下网络共识如何凝聚？

东风奕派全面接入“华为全家桶”

资本算法垄断流量？守大局立导向凭主体破茧房

独立自主国产操作系统AI智能化生态创新成果发布

小米汽车全国已有484家门店

SpaceX申请部署100万颗卫星

雄安发布“极数”数据大模型加速构建“人工智能+”创新生态

SpaceX申请部署100万颗卫星

折叠屏史上最大电量荣耀Magic V6突破7000mAh：领先友商2代

小米汽车披露开店进展：全国139城已有484家门店

雷军官宣2月1日直播，将回应二手车保值率等话题