当前位置: 首页 » 资讯 » 新科技 » 正文

Nano Banana Pro上线!集成Gemini 3与Veo 3,谷歌不让对手喘息

IP属地 中国·北京 量子位 时间:2025-11-21 00:13:10

梦晨 西风 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌乘胜追击!Gemini 3 Pro好评如潮没两天,最强文生图模型Nano Banana也推出Pro版本

自推出以来还未被任何人追赶上,谷歌自己就给他升级了,真是不让其他家喘口气。



这次不仅仅是提升图像生成质量。

这次Nano Banana Pro又名Gemini 3 Pro Image,整合了Gemini 3 Pro的多模态理解能力以及谷歌搜索的知识库,能理解现实语义与物理逻辑。

比如生成一张自行车维修保养注意事项海报。



招牌技能多个图片混合,这次最多支持14张输入图片,全都能保持一致性,多个人物角色和复杂场景也不惧。



此外还在Nano Banana基础上强化了文本渲染,结合多模态理解能力,可以直接把图片中的英文文字翻译成韩文、中文或其他语言,同时保持原有的设计风格不变。



谷歌这番操作秀翻全网:

>Nano Banana Pro让人感觉AI图像创作一夜间迈入了新阶段。



从创意到生产的完整工作流

Nano Banana Pro最引人注目的技术进步体现在几个方面。

首先是文字渲染能力的大幅提升,不仅能在图像中准确生成清晰可读的文字、艺术字,还支持多种语言的直接渲染。





营销团队可以用它快速设计生成营销素材,实现创意快速迭代:



这项功能的背后是Gemini 3 Pro的强大推理能力。模型不仅理解图像内容,还能理解文字的语义上下文,这让它能够在保持原始艺术风格和布局的同时,准确地进行语言转换。

另一个重大突破是模型与Google Search的深度集成。

这不是简单的搜索功能,而是让模型能够基于谷歌搜索庞大知识库、实时信息生成准确的图表、地图和信息图。

比如你要制作一份关于印度奶茶的食谱图解,模型不仅能生成美观的步骤图,还能确保配料比例和制作步骤的准确性。



还可以升级美化原本简约的PPT页面,就像这款小沙发椅,从原料、生产到运输的全流程,它可以自动在地图上清晰标示说明:



Gemini 3高级推理加持下,生成的针对性强、专业的信息图,可以帮助用户快速将复杂知识可视化。



比如创建一个胰岛素-葡萄糖反馈回路的解释图。

最终生成结果遵循提示词用箭头显示胰腺(β/α细胞)、肝脏与血液之间的通信方向,清楚标注了高葡萄糖和低葡萄糖状态:



创建一张关于生态系统中营养级和能量转移的详细信息图,它直接生成了标注着生产者、初级消费者、次级消费者和三级消费者的金字塔,包含10%能量转移规则的说明,配有生态系统场景插图:



在分辨率和格式支持上,Nano Banana Pro支持2K、4K高清分辨率,能满足专业制作的要求;支持多种宽高比,从社交媒体的方形图片到电影级的2.76:1超宽画幅都能轻松应对。



另外,它还支持自由调整图像的光线、镜头、对焦、色彩调校等物理属性和构图:



比如通过光线和明暗对比重塑画面的视觉逻辑,嗯,这感觉确实不一样了:





指定角色,它还可以快速生成符合某个主题的定制化图片。

例如以雪人为核心角色,聚焦“节日庆祝”主题,在输入框中输入“snowman celebrating the holidays doing a variety of festive activities”(雪人庆祝节日,进行各种节日活动)。



紧接着这个雪人就会出现在滑雪缆车、雪地雪橇、宽扎节布置、厨房烤饼干、烛光晚餐等不同场景中。



工作流整合Veo 3视频生成模型,还可以一键用刚生成的图当关键帧继续生成视频。



全面铺开:从开发者到普通用户都能用上

谷歌这次的发布策略相当全面,覆盖了从开发者到普通用户的各个层面。

对于普通用户,模型将、通过多个渠道提供。在Gemini应用中选择“创建图像”功能时就能使用,免费用户有限额配额,超出后会回退到原始的Nano Banana模型。Google AI Plus、Pro和Ultra订阅用户则享有更高的配额。

对于开发者,Nano Banana Pro已经通过Gemini API在Google AI Studio和Vertex AI中提供。企业级用户可以享受到预配置吞吐量、按需付费以及高级安全过滤器等功能。



谷歌还在新的AI开发平台Google Antigravity中集成了这项技术,让编码代理能够直接利用图像生成功能来生成详细的UI模型或新的视觉资产。

第三方设计工具如Adobe Photoshop和Figma也会集成Nano Banana Pro。



最后,谷歌宣布在Gemini app中推出AI图像验证功能,依托其2023年推出的SynthID数字水印技术(给AI生成的内容加一层“隐形水印”)。

用户可通过上传图像并提问“这是AI生成的吗?”,确认其是否由谷歌AI生成或编辑。



官方表示未来这个功能还将扩展至视频、音频等更多格式及搜索等更多平台。

与此同时,即日起Gemini app、Vertex AI、Google Ads、Flow中的Nano Banana Pro生成图像中将被嵌入C2PA元数据。

换句话说,在这些平台上用Nano Banana Pro做出来的图片,都会自带能查来源和创作信息的专属“数字档案”。

官方Blog:https://blog.google/technology/ai/nano-banana-pro/?utm_source=x&utm_medium=social&utm_campaign=&utm_content=


[1]https://x.com/GoogleDeepMind/status/1991522595129139486

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。