当前位置: 首页 » 资讯 » 新科技 » 正文

梁文锋内部透露:DeepSeek V4将于4月下旬发布

IP属地 中国·北京 编辑:胡颖 创智记 时间:2026-04-10 12:10:50

作者 | 张弛

编辑 | 虞尘

在历经数次跳票传闻后,备受关注的DeepSeek V4即将登场。

据《创智记》从多位知情人士处获悉,DeepSeek创始人梁文锋近日在内部沟通中透露,DeepSeek新一代旗舰大模型DeepSeek V4将于4月下旬正式发布。

此前有相关消息显示,DeepSeek V4不仅将带来万亿参数规模和百万级上下文窗口,更首次实现与华为昇腾等国产芯片的深度适配,标志着中国AI产业在去CUDA化道路上迈出关键一步。

值得关注的是,3月29日晚,DeepSeek经历了整整13小时服务中断。当时官方仅称服务器故障,但多位开发者在恢复后发现,模型输出逻辑发生显著变化:编码结构更清晰,逻辑严谨度飞跃式提升,SVG图形生成能力明显增强。

业内普遍猜测,这次停摆实为V4的灰度测试或全量部署。

据悉,V4将以Apache 2.0协议开源,企业可自主部署。据最新外媒报道,为迎接V4发布,阿里巴巴、字节跳动、腾讯等国内科技巨头已预订数十万片新一代AI算力芯片,计划通过云服务提供DeepSeek新模型,并将其集成到自身AI产品中。受此影响,新AI芯片产品近期价格已上涨约 20%。

此前,DeepSeek发布时间已多次延期。原计划于 2 月中旬春节前后推出大参数版本,后因国产算力深度适配、架构重构与稳定性打磨等原因推迟。

从量化投资跨界AI的梁文锋,正在经历属于他的蜕变。

《晚点》报道,过去一年,DeepSeek团队虽有核心骨干离职(包括R1核心作者郭达雅等),但有人离开,更多人留下,团队并未成建制流失。

2025年下半年以来,梁文锋开始更多提及产品化和商业化,组建产品团队,招聘Agent方向模型策略产品经理,并从纯模型研发向应用层延伸。同时,他正在为公司进行估值,以明确员工期权价值,给予团队更确定的预期。

面对豆包、千问、智谱、Kimi、MiniMax等对手的强力竞争,迟到数月的V4承载着巨大的期待压力——梁文锋能否再次打造全世界最出色的开源大模型?

据了解,V4最大的技术亮点在于LTM(Long Term Memory,长期记忆)能力的突破。

但多位和DeepSeek深入接触合作的AI创业者告诉《创智记》,业界不应抱太高期待,V4很难再复制去年DeepSeek-V3的影响力。

除了DeepSeek V4,混元 3.0 大模型也将于4月正式发布。这是腾讯自 2025 年下半年完成团队架构重组、姚顺雨出任首席 AI 科学家后,推出的首个重磅大模型产品。

标签: 模型 deepseek ai 芯片 梁文锋 v4 参数 创智记 团队

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新