史诗级的一周!AI进化被狠狠按下了“快进键”。
谷歌、OpenAI、xAI三大巨头仿佛约好了一样,同时亮出“底牌”。尤其是谷歌,这次真的可以说是“杀红了眼”,誓要夺回王座。
话不多说,带你复盘这疯狂的一周,看看神仙打架到底有多狠。
一、重磅工具:谷歌Gemini 3全家桶炸场
毫无疑问,本周的主角属于谷歌。Gemini 3 Pro的发布标志着AI时代翻开新篇章,在多模态推理和整体性能上树立了新标杆。
1. Gemini 3 Pro:推理能力翻倍
这是谷歌迄今为止最先进的多模态AI推理模型。
· 性能超群: 在推理、数学、编码、视觉理解等基准测试中均达到SOTA(最先进)水平。
· 数据炸裂: 在最新的ARC-AGI-2基准测试中,开启“深度思考”模式的Gemini 3 Pro拿下了45%的惊人高分!这是此前所有AI模型得分的两倍以上。
· 实战无敌: 在分析视频或编写用户界面代码等实际应用中,表现远超跑分数据。
2. Nano Banana Pro:图像生成的“精细狂魔”
Nano Banana迎来Pro级进化,这次绝不再是“小打小闹”。谷歌基于Gemini 3 Pro打造的这款图像生成模型主打“精准”和“真实”。
· 4K级画质: 支持高达4K分辨率的高保真渲染。
· 文字渲染游刃有余: 文本渲染错误率从56%暴跌至8%。
· 超强指令跟随能力: 支持多达14张参考图的混合生成,非常适合制作复杂的信息图表、产品样机、建筑图纸和漫画。
目前付费用户已可在Gemini App中使用,开发者也可通过API调用。
3. Antigravity:AI原生编程IDE
这款AI编程IDE(集成开发环境)堪称重新定义编程,看来程序员们的生产力工具要换代了。Antigravity IDE不仅拥有代码补全、内联编辑等标配功能,更引入强悍的智能体能力。
· 多智能体工作流: 拥有专门的修Bug智能体、文档智能体,甚至集成了浏览器。
· 智能体管理器: 开发者可以像管理员工一样管理AI。虽然原生支持Gemini 3 Pro,但也兼容其他模型。
谷歌这把王座,基本是坐稳了。据报道,上个月竞争对手OpenAI的研究员们就听说谷歌已经开发出新AI,而且这种新AI在技术路径上似乎已经超越了OpenAI。CEO萨姆·奥特曼(Sam Altman)在内部备忘录中坦言:“我们知道还有很多工作要做,但正在快速追赶。”他特意告诫员工,“我预计外界氛围短期内会比较糟糕。”
然而冰冻三尺非一日之寒。
本周,谷歌CEO桑德尔·皮查伊(Sundar Pichai)发了一条只有五个字母的推文:“iykyk”(懂得都懂)。配图是一张由AI生成的、鲜美多汁的芝士汉堡。
看似玩梗的背后,是谷歌重回科技巅峰的霸气宣言。这表明,在Gemini 3的理解中,现实终于回到正确轴线——芝士被完美地融化在了肉饼之上。
普通人可能觉得这没什么了不起,但在科技大佬眼里,这代表了AI技术的重大飞跃。
前Coinbase首席技术官、知名投资人巴拉吉·斯里尼瓦桑(Balaji Srinivasan)一针见血地指出:“通常情况下,AI模型在处理空间方位,尤其是物体相对位置时非常吃力。但这张图表明Gemini 3解决了这个问题。如果AI能精确地知道芝士该放在哪,它就拥有了真正的空间推理能力。”
市场本周给出了最直接的反馈:谷歌股价飙升至历史新高,市值一举超越微软。
科技媒体BI认为,这是皮查伊长达十年的“AI优先”战略终于开花结果。正如斯里尼瓦桑所评价的那样:“谷歌真的做到了‘放下一切’去专注AI。Gemini 3标志着他们夺回领先优势的时刻。皮查伊不仅将谷歌的收入翻倍至1000亿美元,现在更在技术和商业上将公司带到了前所未有的高度。”
二、强敌环伺:OpenAI与xAI的反击
谷歌虽然风光,但AI领域的对手们也绝非吃素。
1. OpenAI:GPT-5.1来了
本周OpenAI也发布了GPT-5.1-Codex-Max和GPT-5.1 Pro,显然不甘让谷歌独占风头。
· Codex-Max: 专为长周期软件工程设计,能处理长达24小时的任务,并能自动压缩上下文。在SWE-Lancer等基准测试中拿下SOTA成绩。
· Pro升级: ChatGPT Pro升级至GPT-5.1 Pro,被称为“研究级”模式,推理能力大幅增强。
ChatGPT还面向全球所有用户开放群聊功能,这意味着你可以拉朋友和AI一起聊天了。
用户热评: 程序员经过一周体验GPT-5.1 Pro,总体评价认为GPT-5.1是具备怪物级能力的最强模型。推理深度惊人,适合复杂任务,却有安全过滤过度、输出偶尔僵硬的痛点;Codex-Max执行长任务的效率提升30%,但需优化上下文管理。
2. xAI:Grok 4.1极速进化
马斯克麾下的xAI打法非常激进,本周发布了Grok 4.1及其Fast版本。
· Grok 4.1: 在情商和创意写作上大幅提升。其思考模式在LMArena上得分1483,仅次于Gemini 3 Pro。
· Grok 4.1 Fast: 提供200万token的上下文窗口,不仅便宜,还配备强大的Agent Tools API(智能体工具接口),支持联网、搜索X帖子、执行代码等,定位为“最适合深度研究的AI智能体”。
用户热评: “非思考”的Grok 4.1达到了大多数顶级模型仅通过“思维链”模型才能达到的智能水平。
三、硬核工具与开源生态
meta SAM 3 & SAM 3D: 堪称视觉领域的重磅炸弹。meta发布第三代“分割一切”模型(SAM 3),能检测并分割视频中的任何物体。全新的SAM 3D更是能将单张静态照片转化为3D模型。这套技术已经应用在Facebook Marketplace的“实景预览”功能中。
用户热评: 生成速度非常快,但生成多个物体时排列略显混乱,暂无法下载生成文件。
AI2 Olmo 3: 艾伦人工智能研究所发布全开源的SOTA模型Olmo 3(有7B和32B两个版本),不仅开源权重,还开源完整训练流程和数据,真正造福开源社区。
用户热评: 基础模型性能与Qwen 2.5处于同一水平。
Replit Design Mode: 有效利用Gemini 3 Pro的能力,只需一段文字就能生成配色、排版精美的复杂UI界面。
用户热评: 半个小时就出设计作品。没有AI的痕迹,没有千篇一律的紫色渐变,效果真的很好。
Google WeatherNext 2: 谷歌发布的新一代AI气象模型,将集成在Pixel手机和搜索中,让天气预报更准、分辨率更高。
用户热评: AI的预测速度现在比天气变化的速度还要快。
四、机器人与科学前沿
Sunday Robotics Memo: 斯坦福华人团队创立的具身智能公司Sunday Robotics展示了一款名为Memo的人形机器人,它没有复杂的五指手,而是采用双夹爪设计,却能熟练完成洗碗、洗衣和倒咖啡等家务。配合ACT-1“零数据”基础模型,公司期望通过低成本训练降低机器人门槛。
用户热评: 为什么机器人公司如此痴迷于制造恐怖玩意儿?这些机器人里只有Memo一个看起来不会在睡梦中杀了我。你可能会觉得“看起来不致命”应该是家用机器人的首要考虑因素,但显然事实并非如此。干得漂亮!
GPT-5助力科研: OpenAI发布论文,展示GPT-5在数学、物理和生物领域的应用,它甚至帮助研究人员发现了4个此前未解数学问题的证明。
用户热评: 这份长达80页的论文犹如一记警钟,唤醒了科学界。
五、商业与政策风向
英伟达势不可挡: 英伟达最新季度财报营收达570亿美元,超华尔街预期。CEO黄仁勋坦言:“Blackwell芯片供不应求,AI正无处不在。”
用户热评: 利润率50%的生意!这是地球上的事儿吗?
Genspark获巨额融资: AI智能体搜索公司Genspark完成2.75亿美元B轮融资,估值达12.5亿美元。
用户热评: 区区30人团队,短短6个月估值就10亿美元。
政策两重天: 美国白宫正准备由联邦政府接管AI监管权,防止各州“各自为政”;而欧盟则在放宽限制,推迟了高风险AI模型的合规期限,旨在为创新松绑。
六、深度观察:AI音乐的隐忧
Deezer和益普索(Ipsos)合作的一项最新调查揭示有趣现象:97%的听众无法区分人类创作的音乐和AI生成的音乐。
目前每天有超过5万首AI音乐提交Deezer平台。虽然大家都支持标注“AI生成”,但也有51%的人担心,未来流媒体平台会被低质量、通用的“AI口水歌”淹没。
人类的创造力会被海量的AI作品淹没吗?这将取决于我们每个人的选择。
用户热评: 某个说唱歌手突然意识到,他的表现竟然不如一块GPU。
结语:你需要做什么?
这一周让我们清晰看到了未来:AI不再只是陪聊玩具,而是真正进入了“强推理”和“智能体落地”的阶段。
如果你是开发者,第一时间去试用Antigravity和Codex-Max;如果你是设计师,Nano Banana Pro可能会成为新的生产力外挂;如果你是普通用户,记得去体验一下ChatGPT的群聊功能。
在这个技术爆炸的时代,唯一的风险,就是停止学习。(辰辰)





京公网安备 11011402013531号