当前位置: 首页 » 资讯 » 新科技 » 正文

一文详解|Gemini-3,及配套的Antigravity、Gemini CLI、生成式 UI、Otter、Firebase..

IP属地 中国·北京 编辑:刘敏 赛博禅心 时间:2025-11-19 08:07:54

Gemini 3 封神了,纯粹的强大

奥特曼发来贺电(说个八卦:Logan 以前是跟 Sam 的)

写这篇文章前,我把这段 prompt 扔给了刚发布的 Gemini 3 Pro

prompt

「编写一个单文件 HTML 的拟真 GBA 模拟器,使用 CSS 绘制精致的紫色机身。游戏内容为《口袋妖怪》中文版回合制战斗(皮卡丘 VS 妙蛙种子),需引用 GitHub 原版像素素材并使用 Web Audio 合成音效」

没有多轮对话,它吐出了一个完整的项目

自动播放

当然...世界还可以更癫狂,这个小学生练字 依然是一键出的

自动播放

还有这样的、更离谱的例子,来自 twitter

自动播放

@YiTayML

自动播放

@skirano

当然了,你的提示词也不必是文字

自动播放

而下面这个,来自设计师藏师傅,:大厂前端,看着设计稿,figma 设计稿,他能写成这样,第一次走查的时候能写成这样,我就烧高香了

这就是今天凌晨,Google 发布的Gemini 3 。当然也不止这个哈基米3

Gemini 3 Pro:地表最强模型,支持多模态推理、长上下文、Agentic Coding

Google Antigravity:一个原生支持 Agent 开发的平台,管理 Agent 干活

Generative UI:在 Google 搜索中,直接生成交互界面

全线落地:Android Studio、Firebase、Gemini CLI 全部接入,价格极其激进

自动播放

实打实的数值怪

先看下跑分吧,Gemini 3 Pro 在 LMArena Leaderboard 拿到了 1501 Elo,断层领先

LMArena 大模型竞技场

在各种榜单中,也是全面超越之前的王者

Gemini 3 跑分对比图

同时的,对于更长时间跨度的规划能力,Gemini 更是遥遥领先,比如这个 Vending-Bench 2 这个测试(你可以叫他做生意榜单)

Vending Bench 2

为了支撑这种执行力,Google 将思维链(Chain of Thought)做了产品化封装,引入了 Deep Think(深度思考) 模式:

Thought Signatures(思维签名):API 返回中包含加密的“思维过程”,模型在输出前会多步推理、反思、验证。这解决了长链路逻辑中模型容易“想偏”的问题

Thinking Levels(思考等级):开发者在 API 中配置模型“想多久”。对于简单任务选择快速响应,对于复杂逻辑选择深度思考

思考的结果

效果立竿见影:

• 在 Humanity’s Last Exam(人类终极考试)中,开启 Deep Think 模式后,Gemini 3 Pro 的得分从 37.5% 飙升至 41.0%

• 在 GPQA Diamond 测试中更是达到了 93.8%。这是在没有任何外部工具辅助下,纯粹依靠模型推理达到的高度

Coding 工具

最近流行一个词:Vibe Coding,你只需要描述你想要的“感觉”(Vibe)和功能,模型就能把它实现出来

目前,Gemini 3 Pro 也是最强的 Vibe Coding 模型

遥遥领先

更牛逼的是,Google 还为此交付了两套重型生产力工具,Google Antigravity 和 Gemini CLI

全新的 Google Antigravity

Antigravity

这东西的定位,是 Agent 时代的 IDE,如果 VS Code 是为“人”设计的,Antigravity 就是为“人 + Agent”设计的

自动播放

Antigravity 作为一个全新的开发平台(MacOS/Windows/Linux 预览版),它的底层逻辑完全不同于传统 IDE:

任务导向(Task-Oriented):操作单元从“文件”变成了“任务”。开发者在 Inbox 中下发需求

多 Agent 协同:系统支持多 Agent 并行。左边开 Agent 写前端,右边开 Agent 写后端测试,中间 Agent 查文档

自主权(Autonomy):Agent 拥有编辑器、终端、浏览器控制权。它写完代码,自动跑终端,自动开浏览器测试,报错自己修

Artifacts(产物):Agent 交付的不仅是对话,它生成标准化的“产物”——任务列表、实施计划、截图、代码变更

你成了 AI 的老板,去 Review 它的计划,批准它的操作,验收它的成果

更新的 Gemini CLI

Gemini CLI

npm install -g @google/gemini-cli@latest

Gemini CLI,可以理解为 Google 家的类似 Claude Code/ OpenAI Codex,一个命令行 AI 工具:

自然语言转 Shell:输入 gemini 找出上周我改坏的那个 git commit,它会自动解析并执行 git bisect 流程

系统级操作:它可以读写本地文件,重构代码,甚至通过视觉能力,解析图片并生成工程文件

Case

官方演示中,开发者让他来做个3d的金门大桥,于是...就做好了

自动播放

Generative UI:搜索即应用

Google Search 迎来了交互层面的重大升级

自动播放

过去用户搜索“房贷计算器”,得到的是十个链接。现在 Gemini 3 在 AI Mode 下,现场为你一个计算器

这被叫做 Generative UI(生成式用户界面)

动态生成:模型根据具体问题,实时编写 HTML/JS/CSS,并在前端直接渲染交互组件

千人千面:用户问“比较 A 和 B 两款车”,生成的是静态对比表;用户问“买哪款更划算”,生成的是可筛选、排序、高亮的交互决策工具

复杂模拟:用户问“三体引力如何作用”,模型直接生成物理模拟器,用户可以拖动星球观察轨道变化

话说,你觉得 Google 是不是看了我去年的文章啊

AI 的输出,不应是千篇一律的答案,而应像变色龙般适应环境。在手机上它是简洁的决策助手,在电脑前它是全面的分析工具,在嘈杂环境它侧重视觉,在运动场景它善用声音——始终以最适合当下场景的方式传递信息。

金色传说大聪明,公众号:赛博禅心人类的认知协议

全栈生态:Android Studio 与 Firebase

Google 最核心的优势,是其庞大的开发者基建,Gemini 3 这次完成了对 Google 开发生态的底层覆盖。

Android Studio Otter

在最新的 Android Studio Otter 版本中,Gemini 3 Pro 被集成进了 IDE 的核心工作流,被称为 Agent Mode(代理模式)

Agent Mode

超越代码补全,你可以直接下达“重构登录模块以支持新的鉴权协议”这类模糊指令,Gemini 3 会分析整个项目结构,定位相关文件,并执行跨文件的代码修改。

生产级环境

为了支持 Agent Mode 的高频调用和长上下文需求(最高支持 100 万 Token),Google 允许开发者在 IDE 中直接绑定个人的 Gemini API Key

企业级管控

对于团队用户,IT 管理员现在可以通过 Google Cloud 控制台统一配置 Gemini 3 的访问权限,确保代码隐私符合企业合规要求

Firebase AI Logic

过去,移动端开发者要接入大模型,通常需要自己搭建后端服务来转发请求(以隐藏 API Key 并处理鉴权)。Firebase AI Logic SDK 的发布改变了这一架构

Serverless 直连

开发者现在可以通过 iOS、Android、Flutter 或 Web 的客户端 SDK 直接调用 Gemini 3 Pro Preview。Google 在 Firebase 层面托管了鉴权逻辑,开发者无需维护中间层服务器即可安全访问模型。

新增 Thought Signatures 字段

SDK 会自动处理加密的 thought_signature 字段,确保在多轮对话中,模型能够“记住”之前的推理路径。开发者无需手动解析或传递这些复杂的上下文数据,SDK 会在底层自动维护对话状态

Firebase App Check

防止 API 被未授权的客户端滥用;同时支持 Remote Config,允许开发者在不发版的情况下动态调整 prompt 或模型参数。此外,Google 提供了专门的 AI 监控仪表盘,用于实时追踪 Token 消耗、延迟和错误率

硬参数:价格与规格

没有废话,直接看数字

模型版本

gemini-3-pro-preview

上下文窗口

上下文:100 万 Token

最大输出:64k Token

价格策略

• 输入:$2.00 / 100 万 Token

• 输出:$12.00 / 100 万 Token

适用于 200k 以内的上下文

多模态

原生支持文本、图像、音频、视频、PDF

可用性

• 开发者:Google AI Studio / Vertex AI 现已开放

• 企业用户:Gemini Enterprise 集成

• 普通用户:美区 Google AI Pro/Ultra 订阅用户可在 Search 和 App 体验

总结:Google,牛逼!

标签: 模型 用户 开发者 文件 价格 工具 代码 逻辑 任务 视觉 协议 底层 人类 终端 练字 系统 师傅 定位 参数 对话 场景 结果 图片 浏览器 禅心 口袋妖怪 文本 图像 废话 错误率 深度 方式

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。