当前位置: 首页 » 资讯 » 新科技 » 正文

图灵巨头反水!ICML新规血洗学术圈,学术散户只能「裸奔」

IP属地 中国·北京 新智元 时间:2026-01-18 17:36:17


新智元报道

编辑:倾倾

ICML祭出一套疯狂的评审机制,竟成了学术界的救命稻草。连AI教父Bengio都站台支持:在信息过载的时代,我们必须学会利用「偏见」来降噪。

2025年,NeurIPS的投稿洪峰冲破3万大关——这比一年前直接翻了近乎一倍。

这3万篇论文构成的认知过载,足以让现存的任何人类评审系统当场宕机。

学术界的「同行评审」系统,名存实亡。


面对这场审稿危机,ICML 2026终于坐不住了。他们推出了一项极具颠覆性、甚至带有博弈论色彩的新政——作者自评级。


我们审不动了。你们自己招吧:手里这几张牌,哪张是凑数的废纸,哪张是真正的王炸?

这听起来像是「让嫌疑人给自己判案」。如此疯狂的政策为什么能落地?因为它背后站着一位真正的神——Yoshua Bengio。

机制突变:从「猫鼠游戏」到「带枪投案」

ICML2026的这波操作,表面上是在向作者索要权力,实际上是给了一块「免死金牌」。

在过去,同行评审是一场「猫鼠游戏」。

作者是「嫌疑人」,竭尽全力把垃圾包装成金子;评审员是「侦探」,拿着显微镜找破绽。大家互不信任,且互相伤害。

但现在,ICML摊牌了:「侦探不够用了,请嫌疑人协助破案。」

你可能会问:

让作者自评?那还不全员满分?谁会承认自己写的是垃圾?

这正是博弈论最精彩的杀招:保序回归。系统不看你打的分数,它只看你的出牌顺序。

你不需要告诉系统这篇论文是9分还是3分,你只需要告诉系统:在我投的这3篇里,A>B>C

以前,你可以把3篇平庸的5分论文全吹成9分神作,赌评审员眼瞎放水。

现在,如果你为了捞3分的烂文,硬把它排在9分神作之前,结果烂文没救成,神作的分数还被强行拉低。

为什么ICML敢这么做?因为他们手里有数据。

ICML 2023的秘密实验结果显示,作者对自己论文的排序,更能精准预测论文未来的生死。


ICML2023实验数据分析:在不同投稿数量下,蓝色柱状图(自评级校准分)的误差显著低于红色柱状图(评审员原始分)


数据显示,作者自评排在第一位的论文,其16个月后的引用量,是末位论文的200%。

很多时候,评审员因为看不懂,把真正的神作杀掉了;而作者心里门儿清——「这篇是灌水的,那篇才是改变世界的」。

这不只是一次规则调整,这是对「同行评审神圣性」的祛魅。

官方终于承认:在这个信息过载的时代,与其相信一个只读了你论文20分钟的陌生人,不如利用作者想「赢」的野心,引导他说出真话。

图灵奖得主「叛变」:客观已死,偏见万岁

这张牌之所以能打出来,是因为桌子对面坐着一位真正的「神」——Yoshua Bengio


在JASA的官方讨论稿中,Bengio并没有把这看作一次简单的规则修补,他将其定义为:

机器学习与统计学的一次强力协同(PowerfulSynergy)。


不同博弈策略下的误差缩减。通过「保序机制」,均方误差的改善幅度最高达23.48%。

为什么连AI教父都「叛变」了?

在传统的科学理想国里,我们迷信「客观」。我们认为评审员是公正的法官,作者是狡猾的辩护人。

但在Bengio看来,这种洁癖在30000篇投稿的噪音面前,不仅幼稚,而且低效。

Bengio及其合作者DinghuaiZhang在评论中指出了一个极其深刻的哲学转变:

承认「噪音」统治:当评审系统因过载已退化为「随机数生成器」,盲目追求绝对客观,本质上是一种由于傲慢导致的低效。

拥抱「主观」信号:既然作者是最了解论文的人,为什么要把这个「信噪比」最高的信息源屏蔽掉?

因此,所谓的「偏见」,只要经过统计学修正,就是最珍贵的「特征」。这不仅仅是分数的博弈,更是「慢科学」的回归。


你以为Bengio只是支持一种打分算法吗?不。

作为长期呼吁抵制「PublishorPerish(不发表就出局)」的领军人物,Bengio看重的是这个机制背后的「自省」功能。

他甚至在评论中提出了更激进的「多维降维」构想:

未来的作者不应该只排「好坏」,而应该被要求在多个维度上自首:

这篇论文是新颖但粗糙的吗?

还是严谨但老套的?

这是一种对学术浮躁风气的技术性矫正。

当作者被迫对自己的三篇论文进行排序时,他必须在深夜里扪心自问:「难道我真的在灌水?」

这种「强制性内省」,或许才是Bengio眼中,比筛选论文更重要的价值。

算法折叠:豪门疯狂套利,散户只配「裸奔」

如果你看到这里觉得:「太好了,终于有人来整治乱打分的评审了!」

先别急着庆祝。请先看一眼你手中的筹码。

这项看似完美的「博弈论神技」,其实隐藏着一个被默许的「贫富准入门槛」。

「自评级机制」生效的前提,是你必须至少投两篇论文。

你得先有PaperA和PaperB,系统才能通过A>B的逻辑来校准分数。

如果你只投了一篇呢?对不起,系统救不了你。

你依然只能在那个充满了AI垃圾评论、随机打分的旧系统里裸奔。

这是一场针对「学术散户」的精准降维打击。


根据ICML2023的官方统计数据显示,75.5%的作者,只投了一篇论文。

这意味着那25%的「大户」,手里的多篇论文不再只是成果,而是变成了可以相互对冲、用来校准分数的「套利筹码」。

他们可以通过精妙的排序,利用统计学算法为自己的神作穿上「防弹衣」,挡住瞎眼评审的子弹。


MSE缩减的置信区间。在99%的置信水平下,误差缩减依然保持在极高区间,

而75%的「普通玩家」面对的,依然是「俄罗斯轮盘」。

如果遇到一个心情不好的评审员给了你3分,你没有任何数学工具可以反抗。


筹码越多,护甲越厚。观察红蓝柱对比可见,作者投出的论文越多(横轴),利用自评级机制缩减误差(蓝色柱状图下降幅度)的空间往往越稳定。

香港大学的WeichenWang和LSE的ChengchunShi认为,这种机制实际上是在奖励「灌水」。

为了获得「被校准」的资格,为了获得那层算法保护壳,实验室会被迫把一项成果拆成三项(SalamiSlicing),凑足「自评级」的入场券。

以前的强者靠质量通吃;以后的强者,恐将靠「堆量」和「排序策略」进行收割。

ICML2026的新政,或许确实解决了「评审准确度」的问题,但它解决的方式是——优先保护那些拥有更多资源的人。

这是一次赤裸裸的「算法折叠」。

ICML2026砸碎的不仅是评审规则,还有我们对「学术乌托邦」的最后一点幻想。

当人类评审员在30000篇论文的洪流中彻底窒息,机器和算法接管裁判权,已是历史的必然。

这不再是一个比拼谁更「客观」的时代,这是一个比拼谁更懂「博弈」。

ICML已经用算法告诉我们,在算力爆炸的今天,「诚实」不再是一种高尚的道德自律,而是一条被博弈论强制执行的、冷冰冰的「生存策略」。

醒醒吧,旧世界已经塌了。

参考资料:


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新