中国电信人工智能研究院(TeleAI)发布了一项突破性的生成式视频压缩技术——GVC(Generative Video Compression)。该技术将视频数据的压缩率提升到了惊人的 0.02%,意味着原本1GB 大小的视频文件,理论上仅需传输约200KB 的数据即可还原观看,且画质依然清晰。
这项技术的核心逻辑被称为“用计算换带宽”。与传统视频编码(如 H.265或 H.266)依靠“搬运像素”的逻辑不同,GVC 不再传递完整的画面像素,而是传递“如何画出画面”的指令。这些极小的数据包被称为“压缩 Token”,其中包含了画面的语义信息(场景、物体结构)和运动信息(动作趋势)。
在接收端,预训练的生成式模型会扮演“画师”的角色。它根据收到的 Token 指令,结合自身掌握的海量世界知识(如海浪、足球的视觉特征),实时“脑补”并生成出连贯、真实的视频画面。这种模式直接绕过了传统技术在极低带宽下容易出现的画面崩盘和卡顿问题。
根据 TeleAI 发布的技术报告,GVC 在权威数据集上的测试表现远超传统算法。在同等视觉质量下,传统方法消耗的带宽是 GVC 的6倍以上。目前,该模型已能在消费级显卡(如 RTX4090)上实现接近实时的生成速度。这项技术未来有望在远洋通信、应急救援、深空探测等极端网络环境下,解决高清视频传输的燃眉之急。
技术报告地址:
https://www.arxiv.org/abs/2512.24300
划重点:





京公网安备 11011402013531号