梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI
谷歌乘胜追击!Gemini 3 Pro好评如潮没两天,最强文生图模型Nano Banana也推出Pro版本
自推出以来还未被任何人追赶上,谷歌自己就给他升级了,真是不让其他家喘口气。
![]()
这次不仅仅是提升图像生成质量。
这次Nano Banana Pro又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。
比如生成一张自行车维修保养注意事项海报。
![]()
招牌技能多个图片混合,这次最多支持14张输入图片,全都能保持一致性,多个人物角色和复杂场景也不惧。
![]()
此外还在Nano Banana基础上强化了文本渲染,结合多模态理解能力,可以直接把图片中的英文文字翻译成韩文、中文或其他语言,同时保持原有的设计风格不变。
![]()
谷歌这番操作秀翻全网:
>Nano Banana Pro让人感觉AI图像创作一夜间迈入了新阶段。
![]()
从创意到生产的完整工作流
Nano Banana Pro最引人注目的技术进步体现在几个方面。
首先是文字渲染能力的大幅提升,不仅能在图像中准确生成清晰可读的文字、艺术字,还支持多种语言的直接渲染。
![]()
![]()
营销团队可以用它快速设计生成营销素材,实现创意快速迭代:

这项功能的背后是Gemini 3 Pro的强大推理能力。模型不仅理解图像内容,还能理解文字的语义上下文,这让它能够在保持原始艺术风格和布局的同时,准确地进行语言转换。
另一个重大突破是模型与Google Search的深度集成。
这不是简单的搜索功能,而是让模型能够基于谷歌搜索庞大知识库、实时信息生成准确的图表、地图和信息图。
比如你要制作一份关于印度奶茶的食谱图解,模型不仅能生成美观的步骤图,还能确保配料比例和制作步骤的准确性。
![]()
还可以升级美化原本简约的PPT页面,就像这款小沙发椅,从原料、生产到运输的全流程,它可以自动在地图上清晰标示说明:

Gemini 3高级推理加持下,生成的针对性强、专业的信息图,可以帮助用户快速将复杂知识可视化。
![]()
比如创建一个胰岛素-葡萄糖反馈回路的解释图。
最终生成结果遵循提示词用箭头显示胰腺(β/α细胞)、肝脏与血液之间的通信方向,清楚标注了高葡萄糖和低葡萄糖状态:

创建一张关于生态系统中营养级和能量转移的详细信息图,它直接生成了标注着生产者、初级消费者、次级消费者和三级消费者的金字塔,包含10%能量转移规则的说明,配有生态系统场景插图:

在分辨率和格式支持上,Nano Banana Pro支持2K、4K高清分辨率,能满足专业制作的要求;支持多种宽高比,从社交媒体的方形图片到电影级的2.76:1超宽画幅都能轻松应对。

另外,它还支持自由调整图像的光线、镜头、对焦、色彩调校等物理属性和构图:

比如通过光线和明暗对比重塑画面的视觉逻辑,嗯,这感觉确实不一样了:
![]()
![]()
指定角色,它还可以快速生成符合某个主题的定制化图片。
例如以雪人为核心角色,聚焦“节日庆祝”主题,在输入框中输入“snowman celebrating the holidays doing a variety of festive activities”(雪人庆祝节日,进行各种节日活动)。
![]()
紧接着这个雪人就会出现在滑雪缆车、雪地雪橇、宽扎节布置、厨房烤饼干、烛光晚餐等不同场景中。

工作流整合Veo 3视频生成模型,还可以一键用刚生成的图当关键帧继续生成视频。

全面铺开:从开发者到普通用户都能用上
谷歌这次的发布策略相当全面,覆盖了从开发者到普通用户的各个层面。
对于普通用户,模型将、通过多个渠道提供。在Gemini应用中选择“创建图像”功能时就能使用,免费用户有限额配额,超出后会回退到原始的Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户则享有更高的配额。
对于开发者,Nano Banana Pro已经通过Gemini API在Google AI Studio和Vertex AI中提供。企业级用户可以享受到预配置吞吐量、按需付费以及高级安全过滤器等功能。
![]()
谷歌还在新的AI开发平台Google Antigravity中集成了这项技术,让编码代理能够直接利用图像生成功能来生成详细的UI模型或新的视觉资产。
第三方设计工具如Adobe Photoshop和Figma也会集成Nano Banana Pro。
![]()
最后,谷歌宣布在Gemini app中推出AI图像验证功能,依托其2023年推出的SynthID数字水印技术(给AI生成的内容加一层“隐形水印”)。
用户可通过上传图像并提问“这是AI生成的吗?”,确认其是否由谷歌AI生成或编辑。

官方表示未来这个功能还将扩展至视频、音频等更多格式及搜索等更多平台。
与此同时,即日起Gemini app、Vertex AI、Google Ads、Flow中的Nano Banana Pro生成图像中将被嵌入C2PA元数据。
换句话说,在这些平台上用Nano Banana Pro做出来的图片,都会自带能查来源和创作信息的专属“数字档案”。
官方Blog:https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=
[1]https://x.com/GoogleDeepMind/status/1991522595129139486





京公网安备 11011402013531号