当前位置：首页 » 资讯 » 新科技 » 正文

阿里发布千问旗舰推理模型Qwen3-Max-Thinking

IP属地中国·北京 智通财经 时间：2026-01-27 17:01:05

智通财经APP获悉，1月26日，阿里正式推出千问系列旗舰推理模型Qwen3-Max-Thinking。据悉，Qwen3-Max-Thinking 在多个关键维度上实现了显著提升，包括事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力。在19项权威基准测试中，其性能可媲美 GPT-5.2-Thinking、Claude-Opus-4.5 和 Gemini 3 Pro 等顶尖模型。
Qwen3-Max-Thinking 引入两项核心创新：
(1)自适应工具调用能力，可按需调用搜索引擎和代码解释器，现已上线Qwen Chat；
(2)测试时扩展技术(Test-Time Scaling)，显著提升推理性能，在关键推理基准上超越 Gemini 3 Pro。

下表展示了更全面的评估分数：

自适应工具调用能力
与早期需要用户手动选择工具的方法不同，Qwen3-Max-Thinking 能在对话中自主选择并调用其内置的搜索、记忆和代码解释器功能。该能力源于专门设计的训练流程：在完成初步的工具使用微调后，模型在多样化任务上使用基于规则和模型的反馈进行了进一步训练。实验表明，搜索和记忆工具能有效缓解幻觉、提供实时信息访问并支持更个性化的回复。代码解释器允许用户执行代码片段并应用计算推理来解决复杂问题。这些功能共同提供了流畅且强大的对话体验。
测试时拓展技术
测试时扩展是指在推理阶段分配额外计算资源以提升模型性能的技术。我们提出了一种经验累积式、多轮迭代的测试时扩展策略。不同于简单增加并行推理路径数量(这往往导致冗余推理)，我们限制并将节省的计算资源用于由“经验提取”机制引导的迭代式自我反思。该机制从过往推理轮次中提炼关键洞见，使模型避免重复推导已知结论，转而聚焦于未解决的不确定性。关键在于，相比直接引用原始推理轨迹，该机制实现了更高的上下文利用效率，在相同上下文窗口内能更充分地融合历史信息。在大致相同的 token 消耗下，该方法持续优于标准的并行采样与聚合方法:GPQA (90.3 → 92.8)、HLE (34.1 → 36.5)、LiveCodeBench v6 (88.0 → 91.4)、IMO-AnswerBench (89.5 → 91.5) 和 HLE (w/ tools) (55.8 → 58.3)。
Qwen3-Max-Thinking 现已上线 Qwen Chat，用户可直接与模型及其自适应工具调用功能进行交互。同时，Qwen3-Max-Thinking 的 API(模型名称为 qwen3-max-2026-01-23)也已开放。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

腾讯副总裁谈“龙虾”：大幅提振B端AI意愿

AI重塑教学，算力赋能育才！华为探寻教育数智化转型新路径

鲲鹏+凌川科技SL200，用极致算力为互联网视频产业带来质变

华为云发布FlexNPU，打造弹性伸缩的“算力金箍棒”

资本与技术的双重博弈：OpenAI天量融资的启示与思考

华为天才少年为何纷纷转战机器人赛道？

全站最新

腾讯副总裁谈“龙虾”：大幅提振B端AI意愿

AI重塑教学，算力赋能育才！华为探寻教育数智化转型新路径

鲲鹏+凌川科技SL200，用极致算力为互联网视频产业带来质变

华为云发布FlexNPU，打造弹性伸缩的“算力金箍棒”

热门推荐

Patagonia关联公司曾因虚假宣传被罚

皖能电力旗下新能创业投资公司增资至78.2亿增幅约104%

连云港安防产业专项母基金成立出资额10亿

鞠婧祎名下关联2家企业

华为发起维权诉讼索赔百万

歌尔股份旗下潍坊电子公司增资至约18.7亿

张小帆卸任东风特种商用车公司董事长

男子坠亡涉事俱乐部事发时刚成立2个月

鞠婧祎涨粉14万

卜凡团博关联公司成立不足一年

灵心巧手增资至9.2亿

东方电气集团国际合作公司增资至10亿增幅约31%

天津脑机接口产业集团登记成立注册资本10亿

鞠婧祎回应税务情况当日涨粉3万

中国农机加速迈向全球市场，现存农业机械相关企业超286万家