当前位置：首页 » 资讯 » 新科技 » 正文

一文详解｜Gemini-3，及配套的Antigravity、Gemini CLI、生成式 UI、Otter、Firebase..

IP属地中国·北京 编辑：刘敏赛博禅心 时间：2025-11-19 08:07:54

Gemini 3 封神了，纯粹的强大
奥特曼发来贺电（说个八卦：Logan 以前是跟 Sam 的）
写这篇文章前，我把这段 prompt 扔给了刚发布的 Gemini 3 Pro
prompt：
「编写一个单文件 HTML 的拟真 GBA 模拟器，使用 CSS 绘制精致的紫色机身。游戏内容为《口袋妖怪》中文版回合制战斗（皮卡丘 VS 妙蛙种子），需引用 GitHub 原版像素素材并使用 Web Audio 合成音效」
没有多轮对话，它吐出了一个完整的项目
自动播放
当然...世界还可以更癫狂，这个小学生练字依然是一键出的
自动播放
还有这样的、更离谱的例子，来自 twitter
自动播放
@YiTayML
自动播放
@skirano
当然了，你的提示词也不必是文字
自动播放
而下面这个，来自设计师藏师傅，：大厂前端，看着设计稿，figma 设计稿，他能写成这样，第一次走查的时候能写成这样，我就烧高香了
这就是今天凌晨，Google 发布的Gemini 3 。当然也不止这个哈基米3
• Gemini 3 Pro：地表最强模型，支持多模态推理、长上下文、Agentic Coding
• Google Antigravity：一个原生支持 Agent 开发的平台，管理 Agent 干活
• Generative UI：在 Google 搜索中，直接生成交互界面
• 全线落地：Android Studio、Firebase、Gemini CLI 全部接入，价格极其激进
自动播放
实打实的数值怪
先看下跑分吧，Gemini 3 Pro 在 LMArena Leaderboard 拿到了 1501 Elo，断层领先
LMArena 大模型竞技场
在各种榜单中，也是全面超越之前的王者
Gemini 3 跑分对比图
同时的，对于更长时间跨度的规划能力，Gemini 更是遥遥领先，比如这个 Vending-Bench 2 这个测试（你可以叫他做生意榜单）
Vending Bench 2
为了支撑这种执行力，Google 将思维链（Chain of Thought）做了产品化封装，引入了 Deep Think（深度思考）模式：
• Thought Signatures（思维签名）：API 返回中包含加密的“思维过程”，模型在输出前会多步推理、反思、验证。这解决了长链路逻辑中模型容易“想偏”的问题
• Thinking Levels（思考等级）：开发者在 API 中配置模型“想多久”。对于简单任务选择快速响应，对于复杂逻辑选择深度思考
思考的结果
效果立竿见影：
• 在 Humanity’s Last Exam（人类终极考试）中，开启 Deep Think 模式后，Gemini 3 Pro 的得分从 37.5% 飙升至 41.0%
• 在 GPQA Diamond 测试中更是达到了 93.8%。这是在没有任何外部工具辅助下，纯粹依靠模型推理达到的高度
Coding 工具
最近流行一个词：Vibe Coding，你只需要描述你想要的“感觉”（Vibe）和功能，模型就能把它实现出来
目前，Gemini 3 Pro 也是最强的 Vibe Coding 模型
遥遥领先
更牛逼的是，Google 还为此交付了两套重型生产力工具，Google Antigravity 和 Gemini CLI
全新的 Google Antigravity
Antigravity
这东西的定位，是 Agent 时代的 IDE，如果 VS Code 是为“人”设计的，Antigravity 就是为“人 + Agent”设计的
自动播放
Antigravity 作为一个全新的开发平台（MacOS/Windows/Linux 预览版），它的底层逻辑完全不同于传统 IDE：
• 任务导向（Task-Oriented）：操作单元从“文件”变成了“任务”。开发者在 Inbox 中下发需求
• 多 Agent 协同：系统支持多 Agent 并行。左边开 Agent 写前端，右边开 Agent 写后端测试，中间 Agent 查文档
• 自主权（Autonomy）：Agent 拥有编辑器、终端、浏览器控制权。它写完代码，自动跑终端，自动开浏览器测试，报错自己修
• Artifacts（产物）：Agent 交付的不仅是对话，它生成标准化的“产物”——任务列表、实施计划、截图、代码变更
你成了 AI 的老板，去 Review 它的计划，批准它的操作，验收它的成果
更新的 Gemini CLI
Gemini CLI
npm install -g @google/gemini-cli@latest
Gemini CLI，可以理解为 Google 家的类似 Claude Code/ OpenAI Codex，一个命令行 AI 工具：
• 自然语言转 Shell：输入 gemini 找出上周我改坏的那个 git commit，它会自动解析并执行 git bisect 流程
• 系统级操作：它可以读写本地文件，重构代码，甚至通过视觉能力，解析图片并生成工程文件
Case：
官方演示中，开发者让他来做个3d的金门大桥，于是...就做好了
自动播放
Generative UI：搜索即应用
Google Search 迎来了交互层面的重大升级
自动播放
过去用户搜索“房贷计算器”，得到的是十个链接。现在 Gemini 3 在 AI Mode 下，现场为你写一个计算器
这被叫做 Generative UI（生成式用户界面）：
• 动态生成：模型根据具体问题，实时编写 HTML/JS/CSS，并在前端直接渲染交互组件
• 千人千面：用户问“比较 A 和 B 两款车”，生成的是静态对比表；用户问“买哪款更划算”，生成的是可筛选、排序、高亮的交互决策工具
• 复杂模拟：用户问“三体引力如何作用”，模型直接生成物理模拟器，用户可以拖动星球观察轨道变化
话说，你觉得 Google 是不是看了我去年的文章啊
AI 的输出，不应是千篇一律的答案，而应像变色龙般适应环境。在手机上它是简洁的决策助手，在电脑前它是全面的分析工具，在嘈杂环境它侧重视觉，在运动场景它善用声音——始终以最适合当下场景的方式传递信息。
金色传说大聪明，公众号：赛博禅心人类的认知协议
全栈生态：Android Studio 与 Firebase
Google 最核心的优势，是其庞大的开发者基建，Gemini 3 这次完成了对 Google 开发生态的底层覆盖。
Android Studio Otter
在最新的 Android Studio Otter 版本中，Gemini 3 Pro 被集成进了 IDE 的核心工作流，被称为 Agent Mode（代理模式）
Agent Mode
超越代码补全，你可以直接下达“重构登录模块以支持新的鉴权协议”这类模糊指令，Gemini 3 会分析整个项目结构，定位相关文件，并执行跨文件的代码修改。
生产级环境
为了支持 Agent Mode 的高频调用和长上下文需求（最高支持 100 万 Token），Google 允许开发者在 IDE 中直接绑定个人的 Gemini API Key
企业级管控
对于团队用户，IT 管理员现在可以通过 Google Cloud 控制台统一配置 Gemini 3 的访问权限，确保代码隐私符合企业合规要求
Firebase AI Logic
过去，移动端开发者要接入大模型，通常需要自己搭建后端服务来转发请求（以隐藏 API Key 并处理鉴权）。Firebase AI Logic SDK 的发布改变了这一架构
Serverless 直连
开发者现在可以通过 iOS、Android、Flutter 或 Web 的客户端 SDK 直接调用 Gemini 3 Pro Preview。Google 在 Firebase 层面托管了鉴权逻辑，开发者无需维护中间层服务器即可安全访问模型。
新增 Thought Signatures 字段
SDK 会自动处理加密的 thought_signature 字段，确保在多轮对话中，模型能够“记住”之前的推理路径。开发者无需手动解析或传递这些复杂的上下文数据，SDK 会在底层自动维护对话状态
Firebase App Check
防止 API 被未授权的客户端滥用；同时支持 Remote Config，允许开发者在不发版的情况下动态调整 prompt 或模型参数。此外，Google 提供了专门的 AI 监控仪表盘，用于实时追踪 Token 消耗、延迟和错误率
硬参数：价格与规格
没有废话，直接看数字
模型版本
gemini-3-pro-preview
上下文窗口
上下文：100 万 Token
最大输出：64k Token
价格策略：
• 输入：$2.00 / 100 万 Token
• 输出：$12.00 / 100 万 Token
适用于 200k 以内的上下文
多模态
原生支持文本、图像、音频、视频、PDF
可用性：
• 开发者：Google AI Studio / Vertex AI 现已开放
• 企业用户：Gemini Enterprise 集成
• 普通用户：美区 Google AI Pro/Ultra 订阅用户可在 Search 和 App 体验
总结：Google，牛逼！

标签：模型用户 开发者 文件价格工具代码逻辑任务视觉协议底层人类终端练字系统师傅定位参数对话场景结果图片 浏览器 禅心 口袋妖怪 文本图像废话 错误率 深度方式

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

“鹅厂门口免费安装”近千人排队，爆火的“龙虾”究竟是什么？

OpenAI发布GPT-5.4模型成首个可直接操作计算机的通用AI

估值7亿美元！OpenAI前高管杀进工厂，要给流水线装上AI大脑

比亚迪发布第二代刀片电池+闪充技术，5分钟充电70%，将自建2万座闪充站

多家科技媒体流量暴跌逾85%，谷歌“AI概览”或引发媒体行业巨震

AI赋能登记+开店一件事升级！20项举措为企业减负

全站最新

“鹅厂门口免费安装”近千人排队，爆火的“龙虾”究竟是什么？

OpenAI发布GPT-5.4模型成首个可直接操作计算机的通用AI

估值7亿美元！OpenAI前高管杀进工厂，要给流水线装上AI大脑

比亚迪发布第二代刀片电池+闪充技术，5分钟充电70%，将自建2万座闪充站

热门推荐

“鹅厂门口免费安装”近千人排队，爆火的“龙虾”究竟是什么？

OpenAI发布GPT-5.4模型成首个可直接操作计算机的通用AI

估值7亿美元！OpenAI前高管杀进工厂，要给流水线装上AI大脑

比亚迪发布第二代刀片电池+闪充技术，5分钟充电70%，将自建2万座闪充站

多家科技媒体流量暴跌逾85%，谷歌“AI概览”或引发媒体行业巨震

AI赋能登记+开店一件事升级！20项举措为企业减负

今年两会上这些企业家，关注人工智能话题

独家对话齐向东：不想被淘汰，就要拥抱AI｜连线两会

B站的年报，写满了差异化

iPhone 17e首批跑分出炉：GPU拖后腿性能不及iPhone 17

苏黎世联邦理工学院新研究：AI已能大规模识别匿名用户真实身份

7年巨亏254亿后，“小破站”终于盈利了

特斯拉规划建设超400桩V4超级充电站

YouTube私信功能测试范围扩大至31个欧洲国家

550余支参赛队加入！2026年上海头脑奥林匹克创新大赛启幕