当前位置：首页 » 资讯 » 新科技 » 正文

“火”了后腾讯混元再上新：图片可变5秒短视频

IP属地中国·北京 编辑：钟景轩羊城派 时间：2025-03-10 17:00:39

接连不断“有动作”的腾讯混元又上新。3月7日，腾讯混元公布图生视频模型并对外开源，同时上线对口型与动作驱动等玩法，并支持生成背景音效及2K高质量视频。
据了解，基于图生视频的能力，用户只需上传一张图片，并简短描述希望画面如何运动、镜头如何调度等，混元即可按照用户要求让图片动起来，变成5秒的短视频，还能自动配上合适的背景音效。此外，上传一张人物图片，并输入希望“对口型”的文字或音频，图片中的人物即可“说话”或“唱歌”；如果选择动作模板，还能一键生成同款跳舞视频。目前用户通过混元AI视频官网即可体验，企业和开发者可在腾讯云申请使用API接口。
此次开源的图生视频模型，是混元文生视频模型开源工作的延续，模型总参数量保持130亿，适用于多种类型的角色和场景，包括写实视频制作、动漫角色甚至CGI角色制作的生成。开源内容包含权重、推理代码和LoRA训练代码，支持开发者基于混元训练专属LoRA等衍生模型。
目前在Github、HuggingFace等主流开发者社区均可下载体验。
文｜记者王丹阳
图｜受访者供图

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

机器人版GPT-3来了：任务成功率99%，「涌现」过后能临场发挥

19岁，常青藤辍学，这群中国年轻人重构了AI记忆

中科宇航力鸿二号可重复使用运载器开启载荷征集，计划今年首飞

全网开骂！Claude订阅「封杀」OpenClaw，想用龙虾？得加钱！

疯狂的Skill

vivo新影像旗舰开启首销，可搭载400mm增距镜

全站最新

机器人版GPT-3来了：任务成功率99%，「涌现」过后能临场发挥

19岁，常青藤辍学，这群中国年轻人重构了AI记忆

中科宇航力鸿二号可重复使用运载器开启载荷征集，计划今年首飞

全网开骂！Claude订阅「封杀」OpenClaw，想用龙虾？得加钱！

热门推荐

机器人版GPT-3来了：任务成功率99%，「涌现」过后能临场发挥

19岁，常青藤辍学，这群中国年轻人重构了AI记忆

中科宇航力鸿二号可重复使用运载器开启载荷征集，计划今年首飞

全网开骂！Claude订阅「封杀」OpenClaw，想用龙虾？得加钱！

疯狂的Skill

vivo新影像旗舰开启首销，可搭载400mm增距镜

Gartner重磅预判：AI就业无末日！每年3200万人饭碗或「砸碎重铸」

6日夜晚至7日凌晨心宿二伴月夜空上演“红白配”

长三角OPC创新发展大会举行，苏州吴江“太湖云湾”来了！

卓胜微双平台战略发布：以自主创新重构射频与工艺技术边界

深圳首次开通无人车夜间配送线路，京东“独狼”串联坪山、龙岗

回到2016：赶在AI、战争和短视频到来之前

AR眼镜龙头冲刺IPO：三年亏超20亿，阿里快手雷军都投了

“AI+一人公司”火了，有人称对比带团队阶段利润率提升超20%，多地出台相关扶持政策

AI彻底改写全球市值排行榜 TOP25半导体独占7席：三年翻了一倍多