前阿里千问技术负责人林俊旸,在离职后首次公开发声,就用一篇长文《从“推理”思维到“智能体思维”》,给这场讨论定了调——大模型的未来,不是比谁的推理链更长,而是要学会“为行动而思考”,在与世界的互动中解决问题。…
这篇题为《从“推理式思维”到“智能体式思维”》的文章,堪称一份清晰的AI行业技术路线图,直指行业过去两年的发展误区,也点明了未来的核心转型方向:从训练模型转向训练智能体。 跳出单纯追求深度推理的误区,AI行…
他透露,千问团队曾试图通过 Qwen3 打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量Token 进行复杂推演,两者在数据分布和行为目标上存在根本冲突。 针…
他提到,2025 年初,千问团队有一个很大的野心:做一个统一的系统,让思考模式和指令模式合二为一,支持可调节的推理努力程度(类似于低/中/高推理设置),甚至能根据提示词和上下文自动推断合适的推理量,让模型自…
他透露,千问团队曾试图通过Qwen3打造支持混合思考模式的系统,但在实际推进中发现,指令模型追求极简与低延迟,而思考模型需要消耗大量Token进行复杂推演,两者在数据分布和行为目标上存在根本冲突。 针对下一阶…
单纯延长模型内部推理轨迹的时代将过去,未来的主导将是在与环境交互中持续迭代的智能体思考。
从与前代模型Qwen3-Max与Qwen2.5-Max的对比数据来看,这一版本的提升在多个高频文本与推理场景中。 从Qwen3-Max的参数规模推测,Qwen3.5-Max很可能是阿里当前参数规模最大的模型…
这不是一次普通的组织架构调整,而是阿里AI从“项目制“走向“事业群制”的质变,是中国大模型行业从“开源浪漫期”进入“商业兑现期”的标志性事件。过去两年,阿里在AI领域的投入不可谓不大,但一位前阿里人士反思:“…
阿里大变阵,林俊旸离职真相浮出水面
围绕Token运转,把能力带到真实场景。
3月12日,有知情人士透露,原阿里通义实验室Qwen(千问)大模型后训练负责人郁博文已加入字节跳动,担任Seed团队视觉模型与多模态交互团队后训练负责人。 郁博文2022年通过阿里“阿里星”校招项目加入达摩…
红星资本局3月12日消息,今日,有知情人士透露,原阿里通义实验室Qwen(千问)大模型后训练负责人郁博文已加入字节跳动,担任Seed团队视觉模型与多模态交互团队后训练负责人。 早在2024年12月,有消息称,…
意味着千问在追赶甚至对标Gemini系列的前沿特性上,获得了一条“近路”。
2026年1月,就在林俊旸参与清华 AGI-Next 前沿峰会后不久,DeepMind的周浩入职了阿里,一开始他入职的是夸克,和此前阿里挖来AI科学家许主洪的情况类似,周浩入职阿里后的前几个月保持了低调,大…
在这些最核心的技术领导者之外,阿里巴巴各个子业务也都分布着大量杰出的技术骨干,例如,最近舆论热议的,从阿里巴巴集团离职的千问大模型负责人林俊旸便是其一。 林俊旸是在周畅离开之后,接任成为千问大模型技术负责人的…
06/13 18:29
06/13 18:26
06/13 18:25
06/13 18:23
06/13 18:20
06/13 18:16
06/13 18:09
06/13 12:07
06/13 12:06