当前位置: 首页 » 资讯 » 新科技 » 正文

阿里通义千问推出图像编辑模型 Qwen-Image-Edit

IP属地 中国·北京 编辑:杨凌霄 通信云 时间:2025-08-25 12:35:34

8 月 19 日,阿里通义千问团队推出了 Qwen-Image-Edit,这一图像编辑版本基于 200 亿参数的 Qwen-Image 模型进一步训练而成,在人工智能领域掀起了新的波澜。这一创新成果不仅为图像编辑带来了新的可能性,更在多方面对 AI 企业产生了深远的影响。

从技术创新的角度来看,Qwen-Image-Edit 的出现代表了 AI 图像技术的重要进步。它成功将 Qwen-Image 独特的文本渲染能力延展至图像编辑领域,实现了对图片中文字的精准编辑。这一突破解决了长期以来图像编辑中文字处理的难题,无论是英文还是中文,均能在保留原有字体、字号、风格的前提下,对文字进行增、删、改等操作,单字渲染准确率高达 97.29%。在中文场景下,其优势更为显著,可轻松应对多行布局、段落级文本生成及书法对联等复杂排版需求,这是许多同类模型难以企及的。这种技术创新为 AI 企业提供了新的技术思路和方向,激励更多企业在图像技术的细节处理上进行深入研究和创新。

在应用场景拓展方面,Qwen-Image-Edit 为 AI 企业打开了更广阔的市场空间。在广告设计领域,企业可以利用该模型快速生成具有视觉冲击力的宣传海报,支持复杂文本排版和风格迁移,大大提高了广告制作的效率和质量。以电商企业为例,过去制作大量产品宣传海报需要投入大量人力和时间,而现在借助 Qwen-Image-Edit,能够快速批量生成高质量的海报,降低了成本,提升了竞争力。

在 IP 内容创作中,该模型可基于品牌吉祥物生成主题表情包,保持角色一致性,帮助企业更好地进行品牌推广和形象塑造。教育与培训行业也能从中受益,快速生成高质量插图和图表,提升课程内容吸引力。对于游戏与影视行业,Qwen-Image-Edit 支持角色设计、背景生成和新视角合成,优化资产开发流程,减少制作周期和成本。这一系列丰富的应用场景为 AI 企业提供了更多的商业机会和发展路径。

在当前的市场环境下,各大科技公司都在积极布局 AI 领域,图像技术是其中的重要战场。Qwen-Image-Edit 凭借其独特的技术优势,如语义与外观双重编辑能力,在多个公开基准测试中取得 SOTA 性能,综合评分分别达到 7.56(英文)和 7.52(中文),超越 GPT Image1 和 FLUX.1Kontext 等同类模型。这种领先的性能表现促使其他 AI 企业加大研发投入,推动整个行业技术的快速迭代和发展。同时,对于一些中小企业来说,Qwen-Image-Edit 的开源策略(以 Apache 2.0 协议全面开源,开发者可通过 Hugging Face、ModelScope 等平台免费获取 60GB 完整模型权重)为他们提供了与大企业在同一起跑线竞争的机会,激发了市场的创新活力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。