当前位置：首页 » 资讯 » 新科技 » 正文

深圳高三生成Kimi重磅论文第一作者，马斯克点赞

IP属地中国·北京 编辑：陆辰风壹零社 时间：2026-03-20 04:14:33

2026年3月，全球人工智能界被一则来自中国的消息所震动：国际学校高三学生陈广宇（Guangyu Chen）以共同第一作者的身份，参与发表了月之暗面（Moonshot AI）Kimi团队的重磅技术论文，其提出的“注意力残差”（Attention Residuals）方法，对Transformer底层架构进行了创新性改进。更引人注目的是，科技领袖埃隆·马斯克在社交平台公开点赞，称“Kimi的工作令人印象深刻”。
01
17岁少年与AI“注意力残差”
2026年3月16日，埃隆·马斯克在社交平台公开称赞中国AI公司月之暗面（Moonshot AI）的Kimi团队研究成果“令人印象深刻”（Impressive work），引发全球AI圈震动。
更令人瞩目的是，这篇题为《Attention Residuals》（注意力残差）的论文共同第一作者中，17岁的深圳高三学生陈广宇（Guangyu Chen）赫然在列，他与知名研究者苏剑林（RoPE旋转位置编码提出者）、张宇（Kimi架构核心开发者）并列署名，三人被标注为“同等贡献”。
在马斯克点赞的光环下，很多人好奇，这项研究究竟突破了什么？
今天的主流大模型几乎都建立在Transformer架构之上，而其中有一个长期沿用、却较少进入公众视野的底层结构——“残差连接”（Residual Connection）。通俗理解，可以把大模型的信息处理过程想象成一条多层传输带。
传统的“残差连接”就像每一层处理完信息后，把原始信息一股脑地打包，连同新的处理结果一起传给下一层。这种方式简单有效，但随着模型层数加深，传输带上会堆积大量冗余信息，真正重要的内容反而容易被“冲淡” 。
Kimi团队提出的“注意力残差”（Attention Residuals）机制，则是对这一底层逻辑的重构。它不再让每一层无差别地接收所有历史信息，而是引入了一个“智能筛选器”，让当前层按需选择最值得参考的内容进行聚合。如果说传统方式是“搬运整座图书馆”，那么“注意力残差”就是“只带走最关键的几页参考文献”。
这项工作的颠覆性在于，它为后发的大模型提供了一条摆脱“堆算力、堆参数”内卷的新路径。公开材料显示，这一方法在Kimi Linear 48B模型上验证后，在效果相近的前提下，训练计算量减少了约20%，相当于获得了1.25倍的效率优势。这意味着，在算力如同战略资源的今天，中国团队试图通过架构创新，从数学层面找到“弯道超车”的可能。
02
“非典型”天才的养成
比起技术本身，17岁的陈广宇如何能参与到这种级别的核心研发中，或许更令公众着迷。
如果梳理他的成长轨迹，会发现这并非一个传统意义上的“学霸保送”故事，而更像互联网时代“天赋与机遇”的精准碰撞。据媒体报道，陈广宇真正深入接触AI研究，仅仅是近一年的事。他的起步方式很“极客”：研读经典论文、追踪GitHub开源项目，以及在社交平台上分享对技术博客的反思。
恰恰是这种开放的分享，成为了他命运的转折点。他在社交平台上的一篇技术反思，引起了一家硅谷AI初创公司CEO的注意，并在通过限时实验测试后，获得了宝贵的实习机会。去年夏天，他远赴美国实习七周，回国后于去年11月加入Kimi团队。在Kimi，他不仅参与了核心研发，还在内部48小时“黑客马拉松”中拿下冠军，证明了自己在实战中的创新能力。
陈广宇的经历，生动地勾勒出数字原生代“天才”的崛起路径：他们不再受限于地理和年龄的隔阂，通过开源社区、社交媒体和全球化的实习机会，可以更早地与前沿知识接轨，完成从“学习者”到“贡献者”的身份跃迁。
03
一份来自17岁的清醒
面对铺天盖地的赞誉，这位少年主角的反应，或许是这起事件中最值得书写的一笔。
在接受媒体采访时，陈广宇多次重复同一句话：不要“造神”，不希望被写成突出个人的故事。他反复强调，这是一项团队共同完成的研究。
事实也确实如此。公开的论文附录清晰地显示，Guangyu Chen、Yu Zhang（张宇）、Jianlin Su（苏剑林）前三位作者均被标注为“同等贡献”（Equal contribution）。
与陈广宇并列的另外两人，是Kimi高效模型架构的重要研究者和旋转位置编码（RoPE）的提出者，都是业内公认的顶尖研究者。论文发布后，陈广宇在朋友圈回顾这段经历时，特别提到了“同等贡献作者”以及从事模型扩展和基础设施工作的同事，称这项工作“缺一不可”。
这份冷静与谦逊，在某种程度上，比技术突破本身更值得珍视。它表明这位年轻人深刻理解现代科研的底层逻辑：在高度复杂的AI领域，任何重大的创新都不是灵光一现的孤胆英雄主义，而是高度组织化的团队协作与思想碰撞的结果。一篇有37位作者署名的重磅论文，恰恰是当代AI研究“大科学”属性的缩影。
04
中国AI新生代的“成人礼”
马斯克的点赞，固然是对技术本身的认可，但其象征意义同样耐人寻味。
这并非一次简单的“隔空喊话”。它意味着中国AI初创公司的底层创新，已经开始进入全球顶级科技领袖的视野。月之暗面作为成立仅两年的“AI四小虎”之一，能够在Transformer的底层架构上动刀，并向全世界展示其技术路径，这本身就是中国AI产业从应用追随走向原始创新的一个信号。
而陈广宇的出现，则让这种信号增添了更多关于“未来”的想象。当一个17岁的中国高中生能够在全球最前沿的AI战场上与顶尖研究者并肩作战，并作出同等贡献时，它打破的不仅是对年龄的刻板印象，更是对中美AI人才储备差距的某种固有焦虑。
正如陈广宇所期望的，我们不应将这个故事简化为“天才少年”的爽文。它的真正价值在于，让我们看到了一个充满活力的创新生态：这里有敢于投入底层研究的公司（Kimi团队），有开放包容的协作机制（共同一作），有能够跨越年龄和地域识别人才的新渠道（社交媒体与开源社区），更有面对荣誉时保持清醒的年轻一代。
不要“造神”，但要“造生态”。当更多的“陈广宇”们能够在这个生态中找到自己的位置，当更多的团队敢于向底层架构发起挑战，中国AI的未来，才真正值得期待。马斯克的点赞或许会过去，但“注意力残差”对AI效率的推动，以及这位17岁少年对科研协作精神的诠释，才刚刚开始留下回响。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

哈啰的多重困局：连年亏损、跨界碰壁、资本撤退

北大毕业送外卖？美团回应：该骑手共跑过5单

泡泡玛特正式官宣LABUBU真人动画电影

马化腾着急了，腾讯AI重启赛马

贾国龙创办新品牌餐厅，人均消费40元至50元

京东外卖为全体全职骑手免费换新装

全站最新

哈啰的多重困局：连年亏损、跨界碰壁、资本撤退

北大毕业送外卖？美团回应：该骑手共跑过5单

泡泡玛特正式官宣LABUBU真人动画电影

马化腾着急了，腾讯AI重启赛马

热门推荐

哈啰的多重困局：连年亏损、跨界碰壁、资本撤退

北大毕业送外卖？美团回应：该骑手共跑过5单

泡泡玛特正式官宣LABUBU真人动画电影

马化腾着急了，腾讯AI重启赛马

贾国龙创办新品牌餐厅，人均消费40元至50元

京东外卖为全体全职骑手免费换新装

被「假必吃榜」坑过？大众点评喊你来举报，查实即有机会得奖

北京进入花粉浓度高峰期，美团医药健康免费开放健康指数助力城市治理

搜索热度增五倍，美团旅行联合上海乐高乐园上线黑金黑钻会员专属权益

霸王茶姬大起大落：大单品神话破灭，加盟商最后的耐心

多多果园AI虚拟好友遭吐槽：精准狙击中老年

纸包厂商大胜达5.5亿入股国产GPU，未获实控权但享有一票否决权

17.72元/股！优必选要约收购部分锋龙股份股权

沃森生物拟20亿元定增引入新控股股东，闽商黄涛或终结公司16年“无主”状态

中式武侠，出路在哪？