当前位置: 首页 » 资讯 » 新科技 » 正文

DeepSeek突然测试新模型,上下文已到百万级

IP属地 中国·北京 编辑:吴婷 凤凰网科技 时间:2026-02-11 20:07:55

2月11日,继被曝出全新V4系列架构规划后,国产大模型头部玩家深度求索今日傍晚逐步推送了一个关键更新。

2月11日,多位用户反馈DeepSeek已在网页及App端开启灰度测试,核心上下文窗口由原有的128K直接提升至1M(百万Token)级别。经科技实测,其自身反馈的上下文长度已更新。

此外,当前版本模型在非联网状态下已能准确输出2025年4月的新闻事件,其知识库截止时间正式更新至2025年5月。

1M上下文窗口的到来,使该模型可在单次处理中完整吞吐《三体》三部曲体量的长文本,直接对标GPT-5及Gemini 3 Pro等海外旗舰产品的长上下文能力。

除参数层级的硬核跃升外,本次灰度测试还释放出显著的体验层信号。多名开发者及早期体验者反馈,新模型的语言风格明显趋向“热情而细腻”,前端响应质感被评价为“可媲美Claude 3.5 Sonnet”。这或是DeepSeek在保持极致推理性能的同时,对C端交互体验发起的一次精准补课。

值得注意的是,此番升级并未包含多模态视觉理解能力,模型仍聚焦于纯文本与语音交互路径。

科技此前曾发现,DeepSeek在近期曾大量招人。放出了多个技术核心岗位招聘,包括深度学习研究员(负责LLM各个方向的前沿探索,如预训练、alignment、codemath、backbone、multimodal等)、深度学习研发工程师(LLM预训练数据/搜索策略相关)、大模型全栈工程师(算法与工程并重,归属于各个前沿探索方向,除了实现还会参与一些环境的部署和搭建)、全栈开发工程师、核心系统研发工程署。且据招聘者表述,校招、社招、实习均开放,另有产品、设计、数据百晓生等岗位开放。

截至目前,深度求索官方尚未就此轮灰度发布命名具体版本号。业内普遍猜测,若该版本对应此前网传的“DeepSeek V4”或强化版V3.2系列。

标签: 模型 工程师 核心 深度 知识库 体验 岗位 凤凰网 数据 文本 国产 灰度 科技 产品 全栈 风格 能力 层级 参数 语音 玩家 头部 路径 商量 质感 部署 关键 评价 环境 算法 开发者 新闻

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。