当前位置：首页 » 资讯 » 新科技 » 正文

前阿里千问负责人林俊旸离职后首发长文，探讨AI未来的发展方向：从训练模型转向训练智能体

IP属地中国·北京 编辑：朱天宇潇湘晨报 时间：2026-03-28 02:19:46

3月26日，原阿里通义千问（Qwen）技术负责人林俊旸（Justin Lin）在社交平台上发布了一篇题为“From ‘Reasoning’ Thinking to‘Agentic’ Thinking（从推理式思考到智能体思考）的文章长文。这是他自本月初从阿里辞职之后发布的第一篇长文。在这篇文章中，林俊旸系统性地复盘了推理模型阶段的特征，并探讨了AI未来的发展方向：从训练模型转向训练智能体。
林俊旸表示，过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明，"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后，证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年，行业焦点主要停留在"推理式思考"本身：如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考：为了行动而思考，在与环境交互的过程中，并根据来自世界的反馈持续更新计划。
他提到，2025 年初，千问团队有一个很大的野心：做一个统一的系统，让思考模式和指令模式合二为一，支持可调节的推理努力程度（类似于低/中/高推理设置），甚至能根据提示词和上下文自动推断合适的推理量，让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上，这是正确的方向。但"合并"说起来容易，做好却极难。
真正的难点在于数据。当人们谈论合并思考与指令时，往往首先想到模型侧的兼容性，更深层的问题是，两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中，团队并未把所有事情都做对，结果往往是在两个方向上都表现平庸："思考"行为变得嘈杂、冗余或不够果断，而"指令"行为则变得不够清晰、不够可靠，且比商业用户实际想要的成本更高。
分开做在实践中仍然有吸引力。2025 年下半年，Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本，30B 和 235B 各一套。而他的最终思考是，真正成功的合并需要一个平滑的推理力度光谱，模型能自己判断该花多少力气去想。
“推理链更长，不等于模型更聪明。很多时候，推理链越长，反而说明模型在乱花算力。”林俊旸在文中表示，他提到，千问团队意识到，行业正在从训练模型的时代，走向训练智能体的时代，它的定义特征是跟真实世界的闭环交互。
智能体式思考和推理式思考，意味着不同的优化目标，推理式思考通常以最终答案前的内部思辨质量来评判：模型能否解出定理、写出证明、生成正确代码或通过基准测试。而智能体思维关注的是：模型能否在与环境交互的过程中持续取得进展。
这意味着，核心问题从“模型能否思考得足够久？”转变为“模型能不能用一种撑得起有效行动的方式来思考？”模型训练的核心对象也随之变了，变成了模型加环境的整个系统。
在这之中，模型架构和训练数据当然还重要，但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调，这些都进了核心圈。“好的思考”的定义也变了：在真实约束下最能撑起行动的那条轨迹，而非最长或最显眼的那条。
林俊旸预测，智能体式思考会成为主流。
此前报道：
《科创板日报》3月4日讯，《科创板日报》记者注意到，3月4日下午，阿里千问大模型核心负责人林俊旸新发朋友圈表示：抱歉各位朋友，今天不回复消息和电话了，我真的需要休息。qwen 的兄弟们，按照原来安排继续干，没问题的。而就在昨日凌晨，林俊旸在社交媒体发文称：me stepping down. bye my beloved qwen.（我卸任了。再见了，我亲爱的千问。）
3月4日凌晨，阿里Qwen技术负责人林俊旸在社交平台上与千问道别，称“我退出了”。随后，阿里巴巴通义实验室科学家惠彬原（Binyuan Hui）转发该条博文并表示自己也退出了千问。南都N视频记者就此向阿里云方面求证，截至发稿尚无回复。
林俊旸在社交平台上与千问道别。
惠彬原称自己也退出了。
林俊旸系阿里千问模型的重要负责人。公开资料显示，林俊旸1993年出生，毕业于北京大学，系阿里巴巴达摩院高级算法专家、阿里通义千问系列大模型技术负责人，主导开发了全球领先的开源大模型。他的研究领域包括自然语言处理和多模态表示学习，研究兴趣集中于大规模语言模型和多模态大模型，曾在多个顶级会议发表多篇论文。公开信息显示，林俊旸对通义千问的技术贡献突出，如他主导开发Qwen3.0等模型性能超越Llama2-70B、首创多模态Agent框架，增强视觉/语音理解能力、推动构建中文社区最大开源模型生态体系等。
有业内人士猜测，林俊旸的离开或由于其考核目标变成了日活跃用户数。对于林俊旸离开后谁会接任其位置，该业内人士也提到或是一位来自谷歌Gemini团队、以日活跃用户数（DAU）指标为导向的非核心人才。南都记者就此向阿里云方面求证，截至发稿尚无回复。
林俊旸与月之暗面创始人兼CEO杨植麟、腾讯首席AI科学家姚顺雨和清华大学教授、智谱创始人兼首席科学家唐杰被在业内并称“基模四杰”，其他几位均为月之暗面、腾讯、智谱等企业的模型掌门人。
今年1月在中关村，林俊旸还提到，自己2021年做模型的时候，阿里芯片团队的人来问自己三年后模型主流架构是不是Transformer和多模态，因为三年后模型才能流片。他表示，“三年之后，我在不在阿里巴巴，我都不知道。但最后我今天还在阿里巴巴，然后他果然还是Transformer，还是多模态，我就非常懊悔为什么当时没有去催他去做。”

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用