美东时间12月17日,谷歌官宣推出Gemini 3家族的新成员Gemini 3 Flash。这款主打快速高效的新模型发布当天即取代Gemini 2.5 Flash成为Gemini App的默认模型,并同步成为谷歌搜索AI模式的默认驱动系统。
据介绍,Gemini 3 Flash在多项基准测试中展现出接近甚至超越更大型模型的表现。在SWE-bench Verified基准测试中,Gemini 3 Flash的解决率达到78%,仅次于GPT-5.2的80%,不仅超越Gemini 2.5系列,甚至优于同门的Gemini 3 Pro,Pro的准确率为76.2%。
![]()
另外,3 Flash拥有前沿的智能技术,速度更快,价格却远低于同类产品。3 Flash 基于3 Pro 强大的多模态、编码和智能体功能,在价格不到3 Pro 四分之一的情况下,提供了更强大的性能和更高的速率限制。新款3 Flash 在多项基准测试中超越了2.5 Pro,速度更快。模型还配备了我们最先进的视觉和空间推理功能,并新增了代码执行功能,可用于缩放、计数和编辑视觉输入。
在 Gemini API 和 Vertex AI 中,Gemini 3 Flash 的定价为每百万个输入令牌0.50美元,每百万个输出令牌3美元(音频输入仍为每百万个输入令牌1美元)。它标配上下文缓存,在令牌重复使用超过特定阈值的情况下,可节省90% 的成本。同样,3 Flash 目前也适用于Batch API,可节省50% 的成本,并大幅提高异步处理的速率限制。对于同步和近实时用例,付费 API 客户还可以使用生产就绪的速率限制。
谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi称,谷歌将Flash定位为老黄牛式的模型。该模型保持了接近Gemini 3 Pro的推理能力,同时运行速度达到Gemini 2.5 Pro的三倍,成本仅为Gemini 3 Pro的四分之一。
在博士级推理和知识基准GPQA Diamond上,Gemini 3 Flash的得分为90.4%。虽然低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%,但其他对手得分还都不到90%。
![]()
在保持智能的同时,3 Flash实现了极高的效率,突破了性能与效率的帕累托极限。它的性能超越了 2.5 Pro,速度提升了 3 倍(基于人工智能分析基准测试),而成本却远低于后者。即使在最低的智能水平下,3 Flash 的性能也常常优于之前版本在高智能水平下的表现。





京公网安备 11011402013531号