比Nano Banana更超神的GPT-Image-2,刚刚正式发布!
请注意,这不是截图,这不是截图:

输入提示词“生成一张和GPT的对话截图”,你就能得到:

再看一眼这样的TikTok短视频截图:

这谁还能分得清是真是假?关键是没给参考图,提示词也非常简短:生成一张TikTok的妆教视频截图。
官方给出的产品正式名称是ChatGPT Images 2.0。
比Nano Banana更超神的GPT-Image-2,刚刚正式发布!
请注意,这不是截图,这不是截图:

输入提示词“生成一张和GPT的对话截图”,你就能得到:

再看一眼这样的TikTok短视频截图:

这谁还能分得清是真是假?关键是没给参考图,提示词也非常简短:生成一张TikTok的妆教视频截图。
官方给出的产品正式名称是ChatGPT Images 2.0。
细看1分49秒的宣传片,会发现这个全新图像生成模型,真的能让很多复杂的工序变成一句话+几秒钟就能搞定的事……
这一回,设计师们真得好好规划一下设计领域的“Vibe Coding”时代了……
实测:简单prompt,超强效果
官方介绍,ChatGPT Images 2.0是OpenAI首个具备“思考”能力的图像模型。
Thinking能力的加入,使得模型可以处理更复杂的任务,在准确性、时效性、一致性和视觉连贯性上有更加强大的表现。
中译中就是,以假乱真不费劲,并且是真生产力工具。
关于ChatGPT Images 2.0有多乱真,我们再做个简单测试:

1,2,3……
左边是ChatGPT Images 2.0生成,右边是真实页面,第一眼看,你猜对了吗?
尽管在生成文字上还是出现了小瑕疵,但在颠覆设计工作流这方面,不得不说GPT-Image-2在Nano Banana之后,又把历史进度条往后拖了一大截。
下面,我们就进入更真实的生产力场景。
商品广告
量子位最近刚好在迭代周边T恤的版本,直接把这个工作交给ChatGPT Images 2.0,来看看它的完成度如何。
提示词:为科技自媒体量子位设计定制T恤,生成宣传图

图中中文文字不少,但还真一个没出错。并且在没有补充量子位背景信息的情况下,从logo到定位,ChatGPT Images 2.0看样子都自己联网把信息收集到位了。
论文海报
再提升一点复杂度,直接抛给ChatGPT一篇论文,让它解读完生成对应的宣传海报。

这样复杂的长图,ChatGPT Images 2.0同样是在短短一句话的提示词下,一次性成功输出了。
并且有了联网搜索能力的加持,某些场景中,用ChatGPT Images 2.0生成类似信息量丰富的海报、卡片,甚至能省去自己搜集资料这一步。
比如,“生成关于原神玩法的推荐海报,官方设定风格”。

更多玩法
当然,如果再开开脑洞,ChatGPT Images 2.0还可以实现更多离谱玩法。
比如,生成作业……

它可不是乱给答案的,不信你算……
(妈妈再也不用担心我的作业不够写)
网友们探索出的玩法还有,生成360度照片:

奥特曼本人也po出了ChatGPT Images 2.0制作的团队故事4格漫画。

这么实测观察下来,官方的总结并非吹牛不打草稿,确实是有那么点“我OpenAI又杀回来了”的气势在:
为图像生成带来了划时代的细致度和保真度。在API中,ChatGPT Images 2.0最高支持生成2K分辨率的图像。
具备更强的多语言理解能力。
支持最宽3:1、最窄1:3的图片比例。
引入更新的世界知识,知识截止时间为2025年12月。
一次提示最多可生成8个输出,并且图中的角色和物体能保持连续性。
另外,在大模型竞技场上,ChatGPT Images 2.0已登顶第一,并且在文本到图像任务中,断层领先第二名Nano Banana 2 240分。

现在, ChatGPT Images 2.0已全量上线到ChatGPT、Codex和OpenAI API中。API具体的价格如下:

GPT-Image-2背后研究团队
这次ChatGPT Images 2.0发布,奥特曼身旁又是一水儿东方面孔。

研究团队的Leader是Gabriel Goh(右二),他博士毕业于加州大学戴维斯分校数学专业,2019年从苹果离职后加入OpenAI。
出镜的几位中依然少不了华人。
陈博远,江苏人,OpenAI研究科学家,本科毕业于伯克利,后于麻省理工取得博士学位。

他的研究侧重于世界模型、具身智能和强化学习。而在研究之余,他还是一位热爱珍珠奶茶的大厨。

One More Thing,根据陈博远的个人主页信息,GPT图像生成模型团队的人数看上去并不多:
我是为数不多的从事训练GPT图像生成模型的研究者之一。
参考链接:
[1]https://openai.com/index/introducing-chatgpt-images-2-0/#textmode
[2]https://x.com/OpenAI/status/2046670977145372771
标签: 图像 模型 海报 官方 量子 信息 团队 规划 物体 伯克利 任务 玩法 戴维斯 加州大学 能力 一致性 陈博远 生产力 图图 T恤 广告 场景 商品 总结 吹牛 奥特曼 分校 麻省理工 以假乱真 进
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
热门推荐