3月26日,原阿里通义千问(Qwen)技术负责人林俊旸(Justin Lin)在社交平台上发布了一篇题为“From ‘Reasoning’ Thinking to‘Agentic’ Thinking(从推理式思考到智能体思考)的文章长文。这是他自本月初从阿里辞职之后发布的第一篇长文。在这篇文章中,林俊旸系统性地复盘了推理模型阶段的特征,并探讨了AI未来的发展方向:从训练模型转向训练智能体。
林俊旸表示,过去两年重塑了行业对大模型的评估方式与核心期待。OpenAI 的 o1 表明,"思考"可以成为一种被训练出来的能力。DeepSeek-R1 紧随其后,证明推理式的后训练可以在原始实验室之外被复现、被扩展。这一阶段至关重要。但 2025 年上半年,行业焦点主要停留在"推理式思考"本身:如何让模型在推理的时候多想一会儿。现在该问下一步了。他的判断是智能体式思考:为了行动而思考,在与环境交互的过程中,并根据来自世界的反馈持续更新计划。
他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自主决定何时直接回答、何时稍作思考、何时为真正困难的问题投入大量计算。概念上,这是正确的方向。但"合并"说起来容易,做好却极难。
真正的难点在于数据。当人们谈论合并思考与指令时,往往首先想到模型侧的兼容性,更深层的问题是,两种模式的数据分布和行为目标存在显著差异。在尝试平衡模型合并与提升后训练数据质量和多样性的过程中,团队并未把所有事情都做对,结果往往是在两个方向上都表现平庸:"思考"行为变得嘈杂、冗余或不够果断,而"指令"行为则变得不够清晰、不够可靠,且比商业用户实际想要的成本更高。
分开做在实践中仍然有吸引力。2025 年下半年,Qwen 的 2507 版本就发了独立的 Instruct 和 Thinking 版本,30B 和 235B 各一套。而他的最终思考是,真正成功的合并需要一个平滑的推理力度光谱,模型能自己判断该花多少力气去想。
“推理链更长,不等于模型更聪明。很多时候,推理链越长,反而说明模型在乱花算力。”林俊旸在文中表示,他提到,千问团队意识到,行业正在从训练模型的时代,走向训练智能体的时代,它的定义特征是跟真实世界的闭环交互。
智能体式思考和推理式思考,意味着不同的优化目标,推理式思考通常以最终答案前的内部思辨质量来评判:模型能否解出定理、写出证明、生成正确代码或通过基准测试。而智能体思维关注的是:模型能否在与环境交互的过程中持续取得进展。
这意味着,核心问题从“模型能否思考得足够久?”转变为“模型能不能用一种撑得起有效行动的方式来思考?”模型训练的核心对象也随之变了,变成了模型加环境的整个系统。
在这之中,模型架构和训练数据当然还重要,但环境设计、rollout 基础设施、评估器的稳健程度、多个 Agent 之间怎么协调,这些都进了核心圈。“好的思考”的定义也变了:在真实约束下最能撑起行动的那条轨迹,而非最长或最显眼的那条。
林俊旸预测,智能体式思考会成为主流。
此前报道:
《科创板日报》3月4日讯,《科创板日报》记者注意到,3月4日下午,阿里千问大模型核心负责人林俊旸新发朋友圈表示:抱歉各位朋友,今天不回复消息和电话了,我真的需要休息。qwen 的兄弟们,按照原来安排继续干,没问题的。而就在昨日凌晨,林俊旸在社交媒体发文称:me stepping down. bye my beloved qwen.(我卸任了。再见了,我亲爱的千问。)
3月4日凌晨,阿里Qwen技术负责人林俊旸在社交平台上与千问道别,称“我退出了”。随后,阿里巴巴通义实验室科学家惠彬原(Binyuan Hui)转发该条博文并表示自己也退出了千问。南都N视频记者就此向阿里云方面求证,截至发稿尚无回复。
林俊旸在社交平台上与千问道别。
惠彬原称自己也退出了。
林俊旸系阿里千问模型的重要负责人。公开资料显示,林俊旸1993年出生,毕业于北京大学,系阿里巴巴达摩院高级算法专家、阿里通义千问系列大模型技术负责人,主导开发了全球领先的开源大模型。他的研究领域包括自然语言处理和多模态表示学习,研究兴趣集中于大规模语言模型和多模态大模型,曾在多个顶级会议发表多篇论文。公开信息显示,林俊旸对通义千问的技术贡献突出,如他主导开发Qwen3.0等模型性能超越Llama2-70B、首创多模态Agent框架,增强视觉/语音理解能力、推动构建中文社区最大开源模型生态体系等。
有业内人士猜测,林俊旸的离开或由于其考核目标变成了日活跃用户数。对于林俊旸离开后谁会接任其位置,该业内人士也提到或是一位来自谷歌Gemini团队、以日活跃用户数(DAU)指标为导向的非核心人才。南都记者就此向阿里云方面求证,截至发稿尚无回复。
林俊旸与月之暗面创始人兼CEO杨植麟、腾讯首席AI科学家姚顺雨和清华大学教授、智谱创始人兼首席科学家唐杰被在业内并称“基模四杰”,其他几位均为月之暗面、腾讯、智谱等企业的模型掌门人。
今年1月在中关村,林俊旸还提到,自己2021年做模型的时候,阿里芯片团队的人来问自己三年后模型主流架构是不是Transformer和多模态,因为三年后模型才能流片。他表示,“三年之后,我在不在阿里巴巴,我都不知道。但最后我今天还在阿里巴巴,然后他果然还是Transformer,还是多模态,我就非常懊悔为什么当时没有去催他去做。”





京公网安备 11011402013531号