当前位置：首页 » 资讯 » 新科技 » 正文

陶哲轩盖章！GPT-5.2杀疯了，我们终将沦为「硅基帕鲁」

IP属地中国·北京 新智元 时间：2026-01-25 18:14:45

新智元报道
编辑：倾倾
币圈玩家Neel Somani带着GPT-5.2暴力踹开了数学圣殿的大门。陶哲轩亲自盖章确认，但这并非「AI成神」，而是一场成功率仅1%的算力挖矿。当数学证明变成工业流水线，我们失去的不仅是天才，还有对真理的最后一点敬畏。
总统先生，数学界的第四座塔倒了！
昨晚，这张总统耳语的Meme图，在美国学术圈引发了核爆级的讨论。

Paul Erdos留下的第281号难题，被一个「门外汉」用AI暴力破解了。

人类最严肃的智力高地，沦为一张Meme图的注脚。旧世界的规则，崩塌了。
第一现场：被GPT-5.2攻破的百年难题
这不仅是破解，更是「入侵」。
一个手持H100算力集群的「野蛮人」，一脚踹开了象牙塔的大门。
光看Neel Somani的履历表，就足以让传统数学家感到信仰崩塌：
前Citadel量化研究员（以高频交易著称的华尔街巨头）；
前Eclipse创始人（Solana生态的高性能区块链项目）；
现役AI与区块链交叉领域的探索者。
他来自Eclipse，混迹于加密货币与区块链的丛林。在他的世界里，算力即权力，共识即真理。

2026年1月，他带着硅谷的算力崇拜，横冲直撞地闯入了数学界——通过投资或协作的方式，推动了ErdosProblems.com平台，把Paul Erdős留下的的数学悬赏，变成了一场公开的「猎杀游戏」。
他的武器不是天才的大脑，而是GPT-5.2Pro。
Somani的逻辑简单粗暴：既然数学证明可以被形式化，那它本质上和比特币挖矿没有任何区别。
只要显卡够多，只要AI试错速度够快，我就能通过穷举撞开真理的大门。

结果呢？他赌赢了。
就在几天前，作为这个收割月的重磅，GPT-5.2成功攻克了Erdős Problem281，源自1980年Erdős和Graham的工作，焦点是「覆盖系统」的极限行为：
给定一个无限递增的正整数序列n₁
这题卡了46年，牵扯到遍历理论、profinite整数上的Haar测度等硬核工具。
Somani的GPT-5.2Pro用遍历理论+点态遍历定理+Dini定理给出了证明，陶哲轩评价这个思路与已知的Rogers/Davenport-Erdős证明相当不同。
X上的网友也将其誉为「第一台真正达到博士级别的AI」。

这已经是2026年1月第三个被GPT-5.2Pro击落的Erdős问题了。
从圣诞节到现在，ErdosProblems.com上已有15个问题从「open」转为「solved」，其中11个明确标注AI参与。
陶哲轩甚至开了个wiki页面，专门记录「AI对Erdős问题的贡献」。

https://github.com/teorth/erdosproblems/wiki/AI-contributions-to-Erd%C5%91s-problems?referrer=grok.com
数学界从「会不会来」直接跳到「来得有多快、会扫荡多少」的恐慌阶段。
Somani用行动告诉世界：不需要理解数学之美，只要电费管够、GPU跑满，就能收割数学界的「圣杯」。
但是，在这一片欢呼声中，如果你去翻看Somani公布的后台数据，就能发现这场「胜利」的底色，其实是一片尸横遍野的荒原。
数据库尸横遍野
Neel Somani赢了，但赢得非常难看。
登陆ErdosProblems.com，关掉「只显示成功」的滤镜，你会看到，后台躺着成千上万具「尸体」。
根据数据库后台的真实统计，GPT-5.2 Pro对这类问题的一次性通过率，只有可怜的1%到2%。
这意味着，为了那个登上头条的完美证明，AI在后台进行了成百上千次的胡言乱语。
它会捏造不存在的引理，陷入逻辑死循环，甚至把数学证明写成一首打油诗。
如果只有一个GPT-5.2，这堆垃圾早就把数学界淹没了。
所以，在这场游戏中，真正的MVP根本不是GPT，而是一个被大众忽略的冷酷工具——「Aristotle」。
Aristotle其实是Harmonic公司开发的专用工具，它把GPT输出的自然语言（经常是胡说八道）自动翻译并强制转换成Lean形式语言，然后交给Lean内核做严格验证。

相当于给AI配了一个「无限试错+零容忍bug」的自动编译+单元测试系统。
没有它，GPT的1%到2%成功率根本无法浮出水面。
现在的AI解题流程越来越标准化。GPT疯狂猜→Aristotle强制形式化+杀垃圾→Lean验证通过→人类再读。
一次，两次，一万次。直到那个概率极低的「幸存者」出现，Aristotle才会放行。
大众以为的「神迹」，其实是统计学必然。
陶哲轩在Mastodon上一针见血。他拒绝使用「Intelligence（智能）」，而是发明了一个新词：「Artificial General Cleverness（人工通用小聪明）」。

注意这个词：小聪明。
就像是一个从来不听课、也没看懂课本的差生，靠着疯狂的作弊和试错，硬生生蒙对了一道奥数题。
而这，正是NeelSomani想要的。对于「挖矿」的人来说，只要能挖出金子，谁在乎矿机懂不懂地质学？
最后的防线：人类只负责「提问」，不再负责「解答」
那么，人类数学家要失业了吗？
未必。但他们的工种，将发生一次彻底的变异。
在Neel Somani开启的这个暴力版本里，数学研究不再是属于艺术家的吟唱，而变成了属于建筑师的图纸。

以前，数学家需要亲自下矿井，一镐一镐地去挖掘真理。现在，GPT-5.2接过了镐头。
人类唯一剩下的特权，也是最后的防线，叫做「定义问题」。
你需要告诉那个疯狂的AI矿工：去哪里挖？挖什么？以及最重要的——为什么值得挖？
这听起来像是升职了，从「矿工」变成了「包工头」。但这背后藏着一个巨大的隐忧：我们正在失去对「为什么」的掌控。
当GPT-5.2扔给你一个长达几千行的Lean证明代码时，Aristotle会告诉你「这是对的」，但你可能根本读不懂中间发生了什么。
表面上，人类从「矿工」升职成了「包工头」。实际上，我们正在丧失对「为什么」的解释权。
数学曾是人类理解宇宙的语言，追求的是极致的优雅和简洁。
而在AI的统治下，数学可能变成一堆虽然正确、但毫无美感的、乱七八糟的「逻辑堆砌物」。

这或许就是陶哲轩所说的「小聪明」的代价。我们用算力换来了效率，却把理解这件事，外包给了机器。
当然，陶哲轩也反复强调，这些被AI快速解决的Erdős问题多属于「最低垂的果实」——可以用标准工具、只是之前没人费心去组合的那一类。
真正最硬核的几十个（比如需要全新思想或新对象的）目前AI还远没有触及。
但问题在于：一旦算力×模型继续指数上升，昨天的「最硬核」可能就是明天的「最低垂果实」。这不是结束，而是加速。
那张500美元的支票，已经被Neel Somani的算法兑现了。
这笔钱很少，但代价昂贵。它兑现了天才的祛魅，瓦解了数学最后的神圣感。
真理不再是上帝的耳语，它只是服务器里风扇狂转后，吐出的一行代码。
从此，决定真理的不再是智商的高低，而是显卡的多少。
醒醒吧，大航海时代结束，工业革命开始了。
当年蒸汽机让肌肉贬值，电力让距离贬值，今天的GPU集群正在让「数学直觉的稀缺性」贬值。
下一个被收割的，可能不是Erdős题，而是某个价值5000万美元的工业优化问题、或者卡了二十年的药物分子设计关键引理。
数学的象牙塔倒了——就像那张总统耳语的Meme图，下一个可能是你的行业。
参考资料：
https://the-decoder.com/gpt-5-2-pro-solves-another-erdos-problem-while-a-new-database-reveals-most-attempts-still-fail/
https://www.erdosproblems.com/forum/thread/281
https://x.com/neelsomani/status/2012695714187325745
https://mathstodon.xyz/@tao/115911902186528812
https://www.erdosproblems.com/forum/thread/281#post-3327

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

专访OpenAI首席科学家：我们离“AI自己做研究”有多远？

马云近期频繁现身，原来在备战三场不能输的战争？

华为云AI战略升级：以行业智能体为中心，打造企业级AI创新“黑土地”

全世界都想用AI焦虑骗你的钱，只有闲鱼AI想帮你赚钱。

上手体验价值5万的MacBook Pro后，我动起了下单的念头。

孙玉院士逝世，他曾参与我国第一颗原子弹试验

全站最新

专访OpenAI首席科学家：我们离“AI自己做研究”有多远？

马云近期频繁现身，原来在备战三场不能输的战争？

华为云AI战略升级：以行业智能体为中心，打造企业级AI创新“黑土地”

全世界都想用AI焦虑骗你的钱，只有闲鱼AI想帮你赚钱。

热门推荐

专访OpenAI首席科学家：我们离“AI自己做研究”有多远？

马云近期频繁现身，原来在备战三场不能输的战争？

华为云AI战略升级：以行业智能体为中心，打造企业级AI创新“黑土地”

全世界都想用AI焦虑骗你的钱，只有闲鱼AI想帮你赚钱。

上手体验价值5万的MacBook Pro后，我动起了下单的念头。

OpenAI计划将员工人数增加一倍

孙玉院士逝世，他曾参与我国第一颗原子弹试验

华为Atlas 350加速卡上市，搭载全新昇腾950PR处理器

一加Ace 6至尊版已备案：天玑9500深度特调性能火力全开

雷神加速器称遭受恶意网络攻击，正在紧急修复

华为畅享90系列下周登场：麒麟8系加持性能史诗级提升

调查：互联网“借贷入口”，无孔不入，无处不在

小鹏汽车八年累计亏430.94亿元，资产破千亿何小鹏财富一年增长超百亿

科学家20年首证：你吸入的每一口二氧化碳，都在悄悄改变血液成分

专访OpenAI首席科学家：我们离“AI自己做研究”有多远？