智通财经APP获悉,11月13日,据腾讯混元官微消息,LiblibAI宣布上线腾讯混元图像3.0(HunyuanImage 3.0),以及腾讯优图视频特效模型Youtu-Video FX,以更强大、更丰富的模型能力助力平台上的千万图像创作者迸发灵感、高效创作。
![]()
LiblibAI是国内最大的AI内容创作平台,致力于专业场景下的AI内容创作与分享,为创意工作者提供专业、可靠、高效的AI时代创作工具。LiblibAI模型/图像创作者已突破两千万,日均保持数百万级创作交互,用户自主训练的原创AI模型与工作流超50万,累计生成图片逾5亿张。
此次上线的腾讯混元图像3.0模型,参数规模高达80B,是首个开源工业级原生多模态生图模型,也是目前效果最好、参数量最大的开源生图模型,效果对标业界头部闭源模型。
混元图像3.0具备常识并能够利用知识进行推理;同时语义理解准确度高,并具备极致美学质感,能生成真实的高质感图片;可以解析千字级别的复杂语义,生成长文本文字,整体图像生成效果业界领先。
原生多模态指在技术架构上,通过一个模型完成文字、图片、视频与音频等多个模态的输入与输出,而非通过多个模型的组合实现图文理解、图片生成等任务。混元图像3.0是业界首个开源工业级原生多模态生图模型。
这意味着,混元图像3.0不仅拥有生图模型的画画能力,还具备语言模型的思考能力和常识。它就像一个自带“大脑”的画家,可以利用智能去思考图像的布局、构图、笔触,利用世界知识去推理常识性的画面。





京公网安备 11011402013531号