当前位置: 首页 » 资讯 » 新科技 » 正文

深圳高三生成Kimi重磅论文第一作者,马斯克点赞

IP属地 中国·北京 编辑:陆辰风 壹零社 时间:2026-03-20 04:14:33

2026年3月,全球人工智能界被一则来自中国的消息所震动:国际学校高三学生陈广宇(Guangyu Chen)以共同第一作者的身份,参与发表了月之暗面(Moonshot AI)Kimi团队的重磅技术论文,其提出的“注意力残差”(Attention Residuals)方法,对Transformer底层架构进行了创新性改进。更引人注目的是,科技领袖埃隆·马斯克在社交平台公开点赞,称“Kimi的工作令人印象深刻”。

01

17岁少年与AI“注意力残差”

2026年3月16日,埃隆·马斯克在社交平台公开称赞中国AI公司月之暗面(Moonshot AI)的Kimi团队研究成果“令人印象深刻”(Impressive work),引发全球AI圈震动。

更令人瞩目的是,这篇题为《Attention Residuals》(注意力残差)的论文共同第一作者中,17岁的深圳高三学生陈广宇(Guangyu Chen)赫然在列,他与知名研究者苏剑林(RoPE旋转位置编码提出者)、张宇(Kimi架构核心开发者)并列署名,三人被标注为“同等贡献”。

在马斯克点赞的光环下,很多人好奇,这项研究究竟突破了什么?

今天的主流大模型几乎都建立在Transformer架构之上,而其中有一个长期沿用、却较少进入公众视野的底层结构——“残差连接”(Residual Connection)。通俗理解,可以把大模型的信息处理过程想象成一条多层传输带。

传统的“残差连接”就像每一层处理完信息后,把原始信息一股脑地打包,连同新的处理结果一起传给下一层。这种方式简单有效,但随着模型层数加深,传输带上会堆积大量冗余信息,真正重要的内容反而容易被“冲淡” 。

Kimi团队提出的“注意力残差”(Attention Residuals)机制,则是对这一底层逻辑的重构。它不再让每一层无差别地接收所有历史信息,而是引入了一个“智能筛选器”,让当前层按需选择最值得参考的内容进行聚合 。如果说传统方式是“搬运整座图书馆”,那么“注意力残差”就是“只带走最关键的几页参考文献”。

这项工作的颠覆性在于,它为后发的大模型提供了一条摆脱“堆算力、堆参数”内卷的新路径。公开材料显示,这一方法在Kimi Linear 48B模型上验证后,在效果相近的前提下,训练计算量减少了约20%,相当于获得了1.25倍的效率优势 。这意味着,在算力如同战略资源的今天,中国团队试图通过架构创新,从数学层面找到“弯道超车”的可能。

02

“非典型”天才的养成

比起技术本身,17岁的陈广宇如何能参与到这种级别的核心研发中,或许更令公众着迷。

如果梳理他的成长轨迹,会发现这并非一个传统意义上的“学霸保送”故事,而更像互联网时代“天赋与机遇”的精准碰撞。据媒体报道,陈广宇真正深入接触AI研究,仅仅是近一年的事。他的起步方式很“极客”:研读经典论文、追踪GitHub开源项目,以及在社交平台上分享对技术博客的反思 。

恰恰是这种开放的分享,成为了他命运的转折点。他在社交平台上的一篇技术反思,引起了一家硅谷AI初创公司CEO的注意,并在通过限时实验测试后,获得了宝贵的实习机会。去年夏天,他远赴美国实习七周,回国后于去年11月加入Kimi团队。在Kimi,他不仅参与了核心研发,还在内部48小时“黑客马拉松”中拿下冠军,证明了自己在实战中的创新能力。

陈广宇的经历,生动地勾勒出数字原生代“天才”的崛起路径:他们不再受限于地理和年龄的隔阂,通过开源社区、社交媒体和全球化的实习机会,可以更早地与前沿知识接轨,完成从“学习者”到“贡献者”的身份跃迁。

03

一份来自17岁的清醒

面对铺天盖地的赞誉,这位少年主角的反应,或许是这起事件中最值得书写的一笔。

在接受媒体采访时,陈广宇多次重复同一句话:不要“造神”,不希望被写成突出个人的故事 。他反复强调,这是一项团队共同完成的研究。

事实也确实如此。公开的论文附录清晰地显示,Guangyu Chen、Yu Zhang(张宇)、Jianlin Su(苏剑林)前三位作者均被标注为“同等贡献”(Equal contribution)。

与陈广宇并列的另外两人,是Kimi高效模型架构的重要研究者和旋转位置编码(RoPE)的提出者,都是业内公认的顶尖研究者。论文发布后,陈广宇在朋友圈回顾这段经历时,特别提到了“同等贡献作者”以及从事模型扩展和基础设施工作的同事,称这项工作“缺一不可”。

这份冷静与谦逊,在某种程度上,比技术突破本身更值得珍视。它表明这位年轻人深刻理解现代科研的底层逻辑:在高度复杂的AI领域,任何重大的创新都不是灵光一现的孤胆英雄主义,而是高度组织化的团队协作与思想碰撞的结果。一篇有37位作者署名的重磅论文,恰恰是当代AI研究“大科学”属性的缩影。

04

中国AI新生代的“成人礼”

马斯克的点赞,固然是对技术本身的认可,但其象征意义同样耐人寻味。

这并非一次简单的“隔空喊话”。它意味着中国AI初创公司的底层创新,已经开始进入全球顶级科技领袖的视野。月之暗面作为成立仅两年的“AI四小虎”之一,能够在Transformer的底层架构上动刀,并向全世界展示其技术路径,这本身就是中国AI产业从应用追随走向原始创新的一个信号。

而陈广宇的出现,则让这种信号增添了更多关于“未来”的想象。当一个17岁的中国高中生能够在全球最前沿的AI战场上与顶尖研究者并肩作战,并作出同等贡献时,它打破的不仅是对年龄的刻板印象,更是对中美AI人才储备差距的某种固有焦虑。

正如陈广宇所期望的,我们不应将这个故事简化为“天才少年”的爽文。它的真正价值在于,让我们看到了一个充满活力的创新生态:这里有敢于投入底层研究的公司(Kimi团队),有开放包容的协作机制(共同一作),有能够跨越年龄和地域识别人才的新渠道(社交媒体与开源社区),更有面对荣誉时保持清醒的年轻一代。

不要“造神”,但要“造生态”。当更多的“陈广宇”们能够在这个生态中找到自己的位置,当更多的团队敢于向底层架构发起挑战,中国AI的未来,才真正值得期待。马斯克的点赞或许会过去,但“注意力残差”对AI效率的推动,以及这位17岁少年对科研协作精神的诠释,才刚刚开始留下回响。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。