当前位置: 首页 » 资讯 » 新科技 » 正文

DeepSeek隐秘的深夜更新:一次关于“专家模式”的留客实验

IP属地 中国·北京 编辑:周伟 听筒Tech 时间:2026-04-09 22:53:54
“专家模式”是蜜糖还是自嗨?

文|听筒Tech 杨林

DeepSeek深夜又悄悄上线新动作。

4月8日凌晨,DeepSeek最新版本输入框新增了快速模式与专家模式。据介绍,两种模式一个适合日常对话,即时响应,一个则擅长复杂问题,高峰需等待。

图:DeepSeek快速版对话框页面

《听筒Tech》截图

比如,两个版本在物理核心、数值方法和代码基础库上使用的是完全一样的,但快速版的算法更适合教学。

物理分析深度方面,快速版只输出了周期、误差,但专家版增加了能量守恒验证及周期随角度变化规律等,而这些,都是物理模拟必须验证的核心指标。

图:DeepSeek关于高峰需等待的提示

《听筒Tech》截图

而放在一年前,DeepSeek刚刚以R1震惊业界时,恐怕没人能预料到它会这么快面临多次服务器被挤爆、超长时间宕机的烦恼。

当然,更重要的是,强哥指出,这也说明,在大模型狂奔的背景下,DeepSeek必须不断奔跑,才能完成加速度。

大模型快速迭代,已经是毋庸置疑的事实。

根据量子位的统计,仅今年1月1日至除夕的47天里,国内公开宣发、具有行业影响力的AI模型技术迭代就超过了30起。也即是说,在国内,平均每1.5天就有一个新模型问世。

国际市场方面,meta在今年元旦当天发布了Llama4 Swarm,Google接连推出Gemini 3.1 Pro,Anthropic更新Claude Sonnet 4.6,OpenAI推新一代Codex

高频的技术脉冲平均每2-3天就引发一次行业热议。这意味着,AI已无缓冲时代,模型竞争已经从谁先跑出来变成谁跟得上。这对DeepSeek而言,同样适用。强哥指出。

当然,在此之前,DeepSeek的迭代节奏也没停过。诸如,今年2月,它就曾进行一次静默升级,将上下文长度从上一代V3系列的128KTokens提升至100万Tokens,实现了数量级跃升。

可以说,回头来看,DeepSeek的更新思路很清晰,先通过静默升级和灰度测试释放技术能力,再用专家模式这样的产品形态让用户逐步感知到变化,最终为完整版V4的正式亮相铺路。强哥表示。

-03-行业从价格战转向质量和算力输出战

但问题是,千万别让市场等待太久。谁也说不准,明天会有什么炸裂的模型横空出世。另外,V4到底能不能给市场惊艳,仍值得观察。强哥坦言。

不可否认的是,AI行业的焦点,已经从价格战转向质量和算力输出战。

2025年,各大厂商还在疯狂压低API价格,试图以价格换市场。到了2026年,竞争的焦点已经转移到了模型真正的解决问题的能力上,这完全是两个世界。强哥坦言。

某种意义上,DeepSeek专家模式的推出,就是在试图证明,AI的价值不仅仅是跑得有多快,而在于它在面对复杂问题时能输出更精准的答案。毕竟,在AI应用加速落地的今天,这直接决定了用户的去留。

除了关注质量,AI的底座,算力竞争也发生了明显的改变。

市场为什么一直关注V4模型,主要原因是底层算力基础设施才是决定上限的关键。强哥指出。

国金证券一份研报指出,算力缺口将在更多模态和更广场景的催化下极速释放,推理侧需求将成为拉动产业链增长的新引擎。截至2026年3月,中国AI大模型日均Token调用量已突破140万亿,较2024年初增长超千倍。

不少分析便指出,DeepSeekV4模型,便可能是完成新一轮算力变局中重要的一个角色。

比如,V4从设计理念上区分了记忆与思考两种智能构架,这些架构优化的直接结果是训练成本断崖式下跌。以V3为例,其训练成本仅为557.6万美元,而GPT-4等模型的训练成本约为1亿美元。

另据The Information报道,DeepSeek新一代模型V4将运行于华为最新芯片之上,且正在开发至少2款完全基于国产AI芯片的大模型,并提前开启优先适配计划。

换句话说,DeepSeek不仅在跟其它模型比赛,也是中国芯+中国模型的一种自主生态路线。

这在全球AI芯片供应仍然紧张、英伟达H100一年期租赁价格涨幅接近40%的背景下,战略意义是很明显的。强哥坦言。

但DeepSeek的路,不好走。强哥表示,3月29日晚,DeepSeek就曾因服务大规模异常冲上热搜,用户频繁遇到服务繁忙提示,深度思考、长文本推理、代码生成等核心功能均受限或无法使用。

虽然,这次故障恢复了,但也暴露了一个问题,当用户量快速膨胀、技术复杂度持续攀升时,服务稳定性和算力支撑能否跟上,是所有大模型公司都必须面对的挑战。

更何况,DeepSeek的Vision视觉版尚未正式上线;C端的用户运营一直偏弱。甚至有评论指出,DeepSeek不怎么维护客户端,大部分C端都流向了国内其他模型。

尽管DeepSeek的迭代速度和技术实力在市场上得到了验证,这次专家模式的升级,本质上也在让产品提供不可替代的价值,但问题是,用户价值才是终极考题。

实际上,在社交平台,就有网友表示,感觉专家模式中的深度思考还不如快速模式的深度思考。甚至有网友表示,根本不在乎DeepSeek是不是更新了、问题是,我现在基本不怎么用DeepSeek了,豆包更聪明......

如果这次的专家模式甚至未来的V4表现持续领先,DeepSeek就能在这场质量战中守住自己的位置;如果只是昙花一现的噱头,那烧掉的研发资源和用户期待,终究会被更快的对手所消化。强哥表示。

这不难理解。当所有玩家都在加速迭代、竞争焦点从价格转向质量、算力成本仍在攀升时,考验就又进入了新的阶段。

而赢家,一定是能用技术和产品持续回答用户为什么选我的那一个。显然,DeepSeek仍在寻找答案。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新