当前位置: 首页 » 资讯 » 新科技 » 正文

华为云首发适配DeepSeek-V4开源大模型 百万Token长上下文推理全面普惠

IP属地 中国·北京 凤凰WEEKLY财经 时间:2026-04-24 22:13:10

2026年4月24日,DeepSeek-V4大模型正式发布并开源,华为云成为首发适配厂商,同步上线高性能推理服务,大幅降低超长上下文使用门槛。

DeepSeek-V4具备百万Token超长上下文能力,在Agent智能体、世界知识与推理性能上达到国内及开源领域领先水平。本次推出的DeepSeek-V4-Flash版本参数优化至284B,参数与激活占用更小,推理成本显著降低,可提供更快捷、经济的API服务,真正实现百万上下文普惠。

适配期间,华为云从系统、算子、集群三层协同发力,在调度效率、计算效率、数据流转效率三大维度全面保障模型快速落地。华为云首发适配分层注意力压缩机制,实现KVCache高效管理,并提供TopK、SWA、CFA等10+昇腾高性能融合算子,结合框架异步调度、MTP多步投机等优化,支持原生1M长上下文高性能推理。

目前,华为云MaaS模型即服务平台已开放免部署、一键调用能力,开发者可直接接入DeepSeek-V4-Flash API,快速构建AI应用。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。