11月21日,腾讯混元大模型团队正式发布并开源HunyuanVideo 1.5,一款基于 Diffusion Transformer(DiT)架构、参数为8.3B的轻量级视频生成模型,支持生成5-10秒的高清视频。
目前,腾讯元宝最新版已上线该模型能力。用户可通过两种方式即可体验:一是输入文字描述(prompt),直接实现“文生视频”;二是上传图片配合prompt,轻松将静态图片转化为动态视频。
![]()
相关使用示意 腾讯官方
据官方介绍,HunyuanVideo 1.5模型具备全面且强大的核心能力,支持中英文输入的文生视频与图生视频。其图生视频能力展现出图像与视频的高度一致性。模型还具备强指令理解与遵循能力,能够精准地实现多样化场景,包括运镜、流畅运动、写实人物和人物情绪表情等多种指令;同时支持写实、动画、积木等多种风格,并可在视频中生成中英文文字。在画质方面,模型可原生生成5–10秒时长的480p和720p高清视频,并可通过超分模型提升至1080p电影级画质。
![]()
HunyuanVideo 1.5 GSB(Good Same Bad) 评测结果
本文系观察者网独家稿件,未经授权,不得转载。





京公网安备 11011402013531号