当前位置: 首页 » 资讯 » 新科技 » 正文

太魔幻了!刚刚OpenAI发布GPT Image 1.5:Nano Banana Pro王座不保

IP属地 中国·北京 编辑:郑佳 AI寒武纪 时间:2025-12-17 08:09:51

Sam Altman 反击谷歌,OpenAI新旗舰图像模型来了

就在刚刚,OpenAI正式发布了新版ChatGPT Images,由全新的旗舰图像生成模型GPT Image 1.5驱动

这一次,无论是从零开始生成图像,还是编辑现有照片,新模型都能实现“所想即所得”

核心升级主要体现在三个方面:精准修图且保留细节指令遵循能力更强,以及生成速度提升了4倍

我立马就测试了两个手头的case:ChatGPT Images vs Nano Banana Pro

提示词

这是一张室内人像写真风格的照片,整体偏向干净、柔和、略带时尚感与亲密氛围,下面我从构图、人物、服装、姿态、光线与整体气质几个层面来忠实、细致地描述:

一、整体构图与环境

•竖幅构图,人物几乎占据画面主体,视觉重心集中在人物的上半身与面部。

•场景是一个简约现代的室内空间,背景为大面积纯白色墙面,干净、无杂物,刻意弱化环境存在感。

•人物坐在一张黑色皮质沙发上,沙发表面线条硬朗,与人物柔和的肤色形成对比。

•沙发上铺着一块黑白相间的长毛绒毯,毛感明显,增加了画面的层次与触感⸻

二、人物外貌与面部特征

•人物为一位年轻女性,整体气质偏清秀、柔和。

•肤色白皙均匀,质感细腻,几乎看不到明显瑕疵。

•脸型偏鹅蛋脸,下颌线柔和,没有明显棱角。

•五官比例协调:

•眼睛偏大,双眼皮清晰,眼神平静、直视镜头,带有一点若有若无的疏离感。

•鼻梁挺直但不夸张。

•嘴唇偏小,唇色自然,表情克制,没有明显微笑。

•整体妆容为清淡自然妆:

•底妆轻薄

•眼妆干净,没有明显烟熏或夸张色彩

•唇妆偏裸色或淡粉色

三、发型与发质

•长直发,发色为偏暖的深棕色。

•中分发型,分缝笔直,左右对称。

•头发顺直、贴合,发尾自然垂落至腰部附近,整体显得柔顺、有光泽。

•发量看起来较多,线条干净,没有明显卷度。

四、服装细节

•穿着一件白色蕾丝连衣裙:

•无袖设计,露出肩部与手臂

•V 领或浅领口,领口处有精细的蕾丝花纹

•裙身贴合身体曲线,但并不夸张

•裙摆长度偏短,停留在大腿中上部

•面料为蕾丝+内衬结构,蕾丝纹理清晰,风格偏女性化、柔美。

五、姿态与肢体语言

•人物以侧坐姿坐在沙发上:

•上半身微微前倾

•一只手自然搭在沙发或毛毯上

•另一只手轻放在腿部

•双腿弯曲收拢,姿态显得放松而内敛。

•整体肢体语言偏安静、克制、略带亲密但不过分张扬。

六、光线与摄影风格

•使用的是柔和的棚拍或自然补光:

•光线均匀,没有强烈阴影

•面部和身体轮廓被柔化

•色温偏中性或微暖,突出肤色的细腻感。

•背景虚化不明显,但因背景简洁,人物自然突出。

•整体风格接近商业人像 / 时尚写真 / AI 或高精修风格。

七、整体气质总结

这张照片给人的感觉是:

•干净

•精致

•柔和

•带一点冷静与疏离

•偏“被观看”的人像美学,而非抓拍或纪实

2k分辨率

这是生成的效果:

第二个case:

提示词:

{

描述:一幅超逼真的 3D 等距视角杰作,描绘了一幅展开在光滑深色木桌上的魔法地图。地图绘制在一张古老而饱经风霜的羊皮纸卷轴上,但画面中的景色以立体模型的形式跃然纸上。巍峨的岩石山脉,白雪皑皑的山峰,穿透缕缕白云;一条蜿蜒的碧绿河流从中心流过;山麓覆盖着茂密葱郁的松林。羊皮纸边缘呈锯齿状,左侧饰有精美的复古书法,角落则绘有罗盘玫瑰图案。画面采用温暖的电影级光照,焦点清晰,纹理细节丰富,2K 分辨率,以奇幻冒险为主题。

negative_prompt: 扁平的,2D 的,简单的图画,模糊的,低质量的,扭曲的,有水印的,糟糕的人体结构,文字叠加,颗粒感强的,

“参数”: {

aspect_ratio: 2:3,

风格: 电影级 3D 渲染,

视图: 等距

}

}

生成的效果:

看起来ChatGPT Images指令遵循的要比NBR要强(人像),审美能力还不好说

目前ChatGPT Images 在 大模型竞技场图像排名第一

接下来几天我会大量测试,看看实际表现

与此同时,GPT Image 1.5 API也已同步上线,价格相比上一代直降20%

下面我们一起来看ChatGPT Images具体细节

精准修图:指哪打哪,细节不丢

新版模型最大的亮点在于对用户意图的精准还原

当用户要求对上传的图片进行编辑时,模型能够更可靠地遵循指令,仅改变用户要求的部分。

而在这一过程中,原图中光线、构图以及人物外观等关键要素,都能在输入、输出及后续的连续编辑中保持一致

这就意味着,ChatGPT现在不仅能完成更实用的照片修饰,还能实现更逼真的服装和发型试穿。同时,它支持在保留原图精髓的基础上,进行风格化滤镜和概念转换

具体到编辑操作上,模型擅长多种类型,包括:

• 添加(Adding)

• 删减(Subtracting)

• 组合(Combining)

• 混合(Blending)

• 移位(Transposing)

简而言之,用户可以在得到想要的改变的同时,不丢失让图片显得特别的那些原始细节。OpenAI称其为“口袋里的创意工作室”

创意与能力的全面进化

除了修图,GPT Image 1.5在创意生成和基础能力上也有显著提升:

创意变换:模型可以通过改变和添加元素(如文本和布局)来实现创意转化,同时保留重要细节,这个和Nano Banana Pro表现感觉差不多

更强的指令遵循:相比初代版本,新模型能更可靠地执行指令。这不仅利于精准修图,也能在生成复杂的原创构图时,按预期保留元素间的关系

文本渲染能力强悍升级:在处理更密集、更小的文本时,模型表现强悍

画质提升:在渲染许多小人脸以及整体输出的自然度等方面,质量均有改进

全新交互:无需提示词也能玩

为了让图像探索更快捷,OpenAI在ChatGPT中推出了专门的Images主页

自动播放

用户可以通过移动应用的侧边栏或chatgpt.com访问该页面。这里不再强制要求用户编写提示词,而是内置了数十种预设的滤镜和提示,帮助用户快速启动灵感

这些预设内容会定期更新,以反映当下的流行趋势

API上线:更便宜,更适合企业

对于开发者和企业用户,GPT Image 1.5 API也已同步开放。

相比GPT Image 1,新版API在图像输入和输出的价格上便宜了20%,这意味着在相同预算下可以进行更多的生成和迭代。

在能力上,API版本继承了ChatGPT Images的所有改进,特别是在图像一致性方面表现更强:

能够跨编辑保持品牌Logo和关键视觉元素的一致性

非常适合营销材料制作(如图形和Logo创作)

适用于电商团队,可基于单一源图像生成完整的产品目录(包括不同变体、场景和角度)

目前,已有创意工具、电商、营销软件等领域的企业开始使用GPT Image 1.5。

最后

ChatGPT Images的新版本即日起向全球所有ChatGPT用户和API用户推送。

该功能跨模型工作,用户在使用时无需进行额外选择

至于今年早些时候推出的旧版ChatGPT Images,将作为一个自定义GPT(Custom GPT)保留,供有需要的用户继续使用

标签: 人物 模型 整体 用户 蕾丝 沙发 图像 风格 画面 光线 能力 编辑 照片 细节 身体 企业 气质 视觉 羊皮纸 地图 一致性 结构 元素 关键 语言 文本 脸型 唇色 中心 大量 上线 姿态 纹理

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。