当前位置: 首页 » 资讯 » 新科技 » 正文

云天励飞披露大算力芯片战略,要把推理成本降低百倍以上

IP属地 中国·北京 南方都市报 时间:2026-02-03 23:16:38

2月3日,云天励飞在深圳举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片战略布局。面对人工智能从“基础模型构建”迈向“规模化应用落地”的重要转折点,公司宣布将核心研发资源集中于攻克大模型落地的成本壁垒,致力于通过底层架构创新,力争实现百万Tokens推理成本降低100倍以上的目标。



过去一年,全球算力产业的风向标已发生显著偏转,重心正加速向推理侧倾斜。谷歌在 2025年4月发布第七代TPU“Ironwood”时,明确将其定位为“面向推理时代”的基石,强调在大规模推理与能效上的系统化优化。

与此同时,围绕“更低时延、更低成本”的推理芯片与系统能力,产业整合动作也在加速。2025年12月,英伟达与Groq达成非独占许可安排,并吸纳其核心工程人才团队加入,此举被视为强化推理与实时工作负载能力的关键布局。

这些行业信号共同指向一个趋势:推理侧竞争已不再单纯是“把模型做得更强”的参数竞赛,而是“让应用跑得更久、更稳、更便宜”的效能竞赛,单位推理成本与交付效率已成为规模化落地的最大门槛。

推理时代的胜负手不在单点指标,而在系统级协同:既要承接主流软件生态,又要在推理负载下实现更优能效与更低时延。

云天励飞确立了 GPNPU 技术路线,并提出了“GPNPU = GPGPU + NPU + 3D 堆叠存储”的核心公式,旨在兼顾通用计算的通用性与NPU的高效性,在工程层面同时解决可迁移、可部署、可持续降本三大难题。

云天励飞董事长兼CEO陈宁在演讲中指出,支撑公司跨越周期的,是长期积累构筑的商业护城河。他将核心竞争力总结为技术、产能、生态、市场、资本五大关键要素。这五大维度的协同共振,不仅是云天励飞应对行业激烈竞争的底气,更为未来三年战略的稳步落地提供了坚实的体系化保障。

针对行业普遍关注的供应链安全问题,云天励飞高级副总裁、CFO兼董秘邓浩然表示,公司目前是国内屈指可数手握充足国产产能保障的企业之一,这一战略储备为后续芯片的大规模量产与交付提供了极高的确定性。

面向未来三年的规划,云天励飞CTO李爱军表示,将不遗余力投入大算力芯片DeepVerse的研发,围绕推理成本、时延与吞吐的核心矛盾持续迭代,并按产品节奏梯度覆盖市场需求。

路线图将对标国际主流平台的代际演进,聚焦长上下文预填充(Prefill)、低时延解码(Decode)等关键推理阶段的系统优化,在真实负载下持续兑现“更便宜、更稳定、更易部署”的交付目标。

推理时代的竞争,本质是“单位推理成本”的竞争。只有把推理做得足够便宜、足够稳定、足够易用,AI 才能从“看得见的能力”走向“用得起的生产力”。

云天励飞表示,未来将以GPNPU架构为核心,大力推进云端大算力强化软硬协同与存储体系攻坚,力争将百万Tokens推理成本降低100倍以上,推动大模型从示范应用走向规模化交付。

采写:南都·湾财社记者 程洋

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。