当前位置：首页 » 资讯 » 新科技 » 正文

DeepSeek又一论文上新

IP属地中国·北京 第一财经资讯 时间：2026-02-27 16:32:48

2026.02.27

本文字数：1213，阅读时长大约3分钟
作者 |第一财经刘晓洁
在业界对新一代旗舰模型DeepSeek V4的翘首期盼中，DeepSeek团队却悄然放出了一篇新的学术论文。

这篇论文由DeepSeek联合北大、清华共同撰写，将研究方向投向了决定大模型实际应用落地的关键一环——推理速度，为日益复杂的AI智能体，提供一套高效的底层系统解决方案。
具体来说，新论文介绍了一个名为DualPath的创新推理系统，专门针对智能体工作负载下的大模型（LLM）推理性能进行优化。通过引入“双路径读取KV-Cache（类似记忆缓存）”机制，重新分配存储网络负载，将离线推理吞吐量最高提升 1.87 倍，在线服务的每秒智能体运行数平均提升 1.96 倍。
论文在引言部分提到，大模型正从单轮对话机器人和独立推理模型，快速演进为智能体系统 ——能够自主规划、调用工具，并通过多轮交互解决实际任务。这种应用范式的转变，推动大模型推理工作负载发生重大变革：从传统的人类-大模型交互，转向人类-大模型-环境交互，交互轮次可达数十甚至数百轮。
上下文会跨轮次累积，最终长度可能达到极值。此时模型不需要大量计算，反而需要频繁从硬盘读取历史上下文的 KV-Cache；现有系统中，只有负责预处理的引擎会读取KV-Cache，它的网卡带宽被占满，而负责生成内容的解码引擎，网卡带宽基本闲置，导致整个系统速度被卡脖子。
因此，论文提出的DualPath，针对智能体工作负载、重新设计现代推理架构中 KV-Cache加载逻辑，解决大模型做智能体任务时，速度被 “数据读取”拖慢的核心问题，重要的是把闲置的带宽资源利用起来，相当于给数据读取 “多开了一条高速路”，实现速度的大幅提升。
这一论文成果延续了DeepSeek一贯的风格，在工程化层面将性能优化推向极致。有从业者认为，DeepSeek做这类优化属于缺显卡的无奈之举，属于“脏活儿累活儿”，大家更期待团队在模型上做创新。
但也有人认为，即便有足够显卡，这类优化在降低成本、降低token费用方面也很有价值，因为只有足够便宜，AI才能走向大规模使用。
相比这篇“务实”的论文，外界显然更关注DeepSeek新一代旗舰模型的真面目。关于DeepSeek V4的发布时间，市场传闻已几经更迭。从最初传闻的2月春节前后，到外媒最新报道的“最快下周”，再到业内人士预测的3月前后，传闻链条愈发扑朔迷离。
就在近日，外网有网友爆料称，DeepSeek 正在测试 V4 Lite 模型，代号为“Sealion-lite”，上下文窗口为 100万tokens，并原生支持多模态推理。也有消息提及，DeepSeek已在近期将重大更新版本V4向华为等国内厂商提供提前访问权，以支持其优化处理器软件，确保模型在硬件上高效运行。然而，英伟达等厂商尚未获得类似权限。
面对传闻，DeepSeek依旧保持其一贯的沉默，目前并未进行任何回应。但市场已进入“严阵以待”状态，部分投资机构担忧，新一代模型的发布会如同去年的版本发布时那样，引发市场的剧烈震荡。
微信编辑| 小羊
第一财经持续追踪财经热点。若您掌握公司动态、行业趋势、金融事件等有价值的线索，欢迎提供。专用邮箱：bianjibu@yicai.com
（注：我们会对线索进行核实。您的隐私将严格保密。）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

外卖食品安全新规出台，淘宝闪购第一时间响应，底气在这

网约车司机和朋友开发外挂软件，挑选消费者“抢”高价订单，郑州6人团伙三个月获利近40万被判刑

马斯克AI电站24小时轰鸣，当地居民被吵到无法居住

穿上皮夹克，手握720亿订单：Salesforce 掌门人手撕“SaaS末日论”

为L3奠定基础！华为智驾能力将迎跨越式升级：尊界S800有望首发全新激光雷达

周鸿祎回应三六零发力AI眼镜：这东西挺难做的

全站最新

外卖食品安全新规出台，淘宝闪购第一时间响应，底气在这

网约车司机和朋友开发外挂软件，挑选消费者“抢”高价订单，郑州6人团伙三个月获利近40万被判刑

马斯克AI电站24小时轰鸣，当地居民被吵到无法居住

穿上皮夹克，手握720亿订单：Salesforce 掌门人手撕“SaaS末日论”

热门推荐

外卖食品安全新规出台，淘宝闪购第一时间响应，底气在这

网约车司机和朋友开发外挂软件，挑选消费者“抢”高价订单，郑州6人团伙三个月获利近40万被判刑

马斯克AI电站24小时轰鸣，当地居民被吵到无法居住

穿上皮夹克，手握720亿订单：Salesforce 掌门人手撕“SaaS末日论”

为L3奠定基础！华为智驾能力将迎跨越式升级：尊界S800有望首发全新激光雷达

周鸿祎回应三六零发力AI眼镜：这东西挺难做的

阿里之后再获创维、博裕等加注，致敬未知获亿元PreA轮融资｜独家

千问免单卡，有效期延期

春节返乡全程体验比亚迪天神之眼5.0 ：全面超越老司机，越用越好开

广发证券：SRAM提升AI推理速度相关架构进入主流大厂视野

AI裁员即暴涨？晨星抨击：重新部署员工比单纯“砍掉”更能释放价值

美股科技重挫之际，马斯克喊话投资者：请继续持有特斯拉股票我赌他会价值连城

一问到底｜津巴布韦锂矿出口禁令影响有多大？新能源汽车会涨价吗？

宾利城市纯电SUV路测图曝光：1156马力，雪地漂移秀实力

不只软件工程师要用，谷歌加大力度督促更多员工使用AI

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

DeepSeek又一论文上新