智通财经APP获悉,摩根大通称,DeepSeek V3.2发布标志中国AI市场迎第二波“DeepSeek冲击”,意味着以中国国内适中的价格即可获得接近前沿模型的开源推理能力,利好中国AI生态的大多数利益相关者,即云运营商、AI芯片制造商、AI服务器制造商、AI智能体平台和SaaS开发商等。分析师Alex Yao在报告中表示,DeepSeek将模型API降价30%-70%,同时长上下文推理可能节省6-10倍的工作量。受益者包括:阿里巴巴(09988)、腾讯(00700)、百度(09888)、中微公司(688012.SH)、北方华创(002371.SZ)、华勤技术(603296.SH)和浪潮信息(000977.SZ)。
12月1日,DeepSeek宣布发布DeepSeek-V3.2正式版模型。DeepSeek-V3.2的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用Agent任务场景。在公开的推理类Benchmark测试中,DeepSeek-V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。
不同于过往版本在思考模式下无法调用工具的局限,DeepSeek-V3.2是该公司推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。公司提出了一种大规模Agent训练数据合成方法,构造了大量"难解答,易验证"的强化学习任务(1800+环境,85,000+复杂指令),大幅提高了模型的泛化能力。
先前的模型V3.1主要针对英伟达CUDA进行了优化,而新模型V3.2/V3.2-Exp则为华为Ascend、寒武纪和海光提供了Day-0支持,并为SGLang、vLLM和其他推理框架提供了现成的内核,标志着明确转向国产硬件自主。





京公网安备 11011402013531号