新京报贝壳财经讯(记者罗亦丹)2月10日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。千问视觉生成负责人吴晨飞在线上发布会上以“准多齐美真”形容该模型的能力。
新京报贝壳财经记者参与发布会发现,上述五字可以简要理解为该模型在进行文字或图像生成时“渲染准、指令多、排版美、文字真、排布齐”。
在演示中,新京报贝壳财经记者注意到,该模型可以支持高达1K tokens的文字输出,并在汉字渲染方面展现了优势,如吴晨飞演示了《兰亭集序》的图片生成,结果不仅生成了人物画面,还生成了以王羲之小楷为字体的数百字古文。
吴晨飞演示《兰亭集序》AI图片生成。
在模型评分方面,作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedream4.5、Flux2-Max等模型,仅次于谷歌Nano Banana Pro和GPT Image1.5。
不过,新京报贝壳财经记者也注意到,同日,字节旗下的图像生成模型Seedream已经升级至5.0,这预示着阿里和字节旗下的图像生成模型将迎来一场“正面对决”。
编辑 杨娟娟
校对 刘军





京公网安备 11011402013531号