当前位置：首页 » 资讯 » 新科技 » 正文

阿里开源视频生成模型 Wan2.2-S2V，一张图生成电影级数字人视频

IP属地中国·北京 编辑：陆辰风 IT之家 时间：2025-08-26 22:24:49

IT之家 8 月 26 日消息，今日晚间，阿里云宣布开源全新多模态视频生成模型通义万相 Wan2.2-S2V，仅需一张静态图片和一段音频，即可生成面部表情自然、口型一致、肢体动作丝滑的电影级数字人视频。
据介绍，该模型单次生成的视频时长可达分钟级，大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。

目前，Wan2.2-S2V 可驱动真人、卡通、动物、数字人等类型图片，并支持肖像、半身以及全身等任意画幅，上传一段音频后，模型就能让图片中的主体形象完成说话、唱歌和表演等动作。
Wan2.2-S2V 还支持文本控制，输入 prompt 后还可对视频画面进行控制，让视频主体的运动和背景的变化更丰富。
例如，上传一张人物弹钢琴的照片、一段歌曲和一段文字，Wan2.2-S2V 即可生成一段完整、声情并茂的钢琴演奏视频，不仅能保证人物形象和原图一致，其面部表情和嘴部动作还能与音频对齐，视频人物的手指手型、力度、速度也能完美匹配音频节奏。

据介绍，Wan2.2-S2V 采用了基于通义万相视频生成基础模型能力，融合了文本引导的全局运动控制和音频驱动的细粒度局部运动，实现了复杂场景的音频驱动视频生成；同时引入 AdaIN 和 CrossAttention 两种控制机制，实现了更准确更动态的音频控制效果；为保障长视频生成效果，Wan2.2-S2V 通过层次化帧压缩技术，大幅降低了历史帧的 Token 数量，通过该方式将 motion frames (IT之家注：历史参考帧) 的长度从数帧拓展到 73 帧，从而实现了稳定的长视频生成效果。
在模型训练上，通义团队构建了超 60 万个片段的音视频数据集，通过混合并行训练进行全参数化训练，充分挖掘了模型的性能。同时通过多分辨率训练、支持模型多分辨率的推理，可支持不同分辨率场景的视频生成需求，如竖屏短视频、横屏影视剧。

实测数据显示，Wan2.2-S2V 在 FID（视频质量，越低越好）、EFID（表情真实度，越低越好）、CSIM（身份一致性，越高越好）等核心指标上取得了同类模型最好的成绩。
阿里云表示，自今年 2 月以来，通义万相已连续开源文生视频、图生视频、首尾帧生视频、全能编辑、音频生视频等多款模型，在开源社区和三方平台的下载量已超 2000 万。
开源地址：
GitHub：https://github.com/Wan-Video/Wan2.2魔搭社区：https://www.modelscope.cn/ models / Wan-AI / Wan2.2-S2V-14BHuggingFace:https://huggingface.co/Wan-AI/Wan2.2-S2V-14B
体验地址：
通义万相官网：https://tongyi.aliyun.com/ wanxiang / generate阿里云百炼：https://bailian.console.aliyun.com/?tab=api#/api/?type=model&url=2978215

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

知名车企CEO预警：智驾芯片，实在是太过剩了

九章云极发布“AI工厂”战略：将建成10万P智能算力集群

MLPerf 6.0训练榜单公布：英伟达Blackwell包揽全部7项第一

台积电产能告急！三星代工需求火热：谷歌、英伟达、AMD都来了…

消息称SK海力士将以ADR形式美股上市，最快7月挂牌

李想谈新能源车纯电和增程技术线路之争：不要踩一捧一，不要搞能源鄙视链

全站最新

知名车企CEO预警：智驾芯片，实在是太过剩了

九章云极发布“AI工厂”战略：将建成10万P智能算力集群

MLPerf 6.0训练榜单公布：英伟达Blackwell包揽全部7项第一

台积电产能告急！三星代工需求火热：谷歌、英伟达、AMD都来了…

热门推荐

圆通速递：5月快递产品收入62.4亿元，同比增长6.68%

字节跳动加量采购国产芯片，互联网大厂竞速搭建算力护城河

韵达股份：5月快递服务业务收入47.17亿元，同比增长6.84%

知名车企CEO预警：智驾芯片，实在是太过剩了

九章云极发布“AI工厂”战略：将建成10万P智能算力集群

MLPerf 6.0训练榜单公布：英伟达Blackwell包揽全部7项第一

台积电产能告急！三星代工需求火热：谷歌、英伟达、AMD都来了…

消息称SK海力士将以ADR形式美股上市，最快7月挂牌

李想谈新能源车纯电和增程技术线路之争：不要踩一捧一，不要搞能源鄙视链

淘宝闪购：坚决拥护国家规范外卖平台补贴行为

理想、小鹏辅助驾驶升级直接对标特斯拉FSD V14

上一发才两天！中科宇航刷新交付速度：力箭一号遥十五顺利出厂

阿里又放大招！一句话，造一个能走进去的世界

荣耀MagicOS 11全新液态玻璃设计揭秘：安卓首创动态全屏通透，支持自定义

全国产！北京AI大模型芯片流片