2026年是“十五五”规划开局之年,也是锚定数字中国建设目标、推动高质量发展的关键节点。“十五五”规划建议明确提出“加快高水平科技自立自强,引领发展新质生产力”,并将“深入推进数字中国建设”列入“十五五”时期经济社会发展的主要目标之一。在这一战略指引下,人工智能作为培育新质生产力、驱动产业变革的核心引擎,正加速从“训练驱动”迈向“推理驱动”的范式转变。
随着各类大模型从技术研发迈向规模化应用,推理算力已成为制约人工智能应用落地和产业深化的关键瓶颈。在此背景下,专注于推理算力的国产GPU企业曦望(Sunrise)紧跟国家战略导向,发布了新一代推理GPU芯片启望S3,提出“百万词元(Token)一分钱”的目标,为破解推理算力成本难题提供了独具特色的国产化解决方案。
![]()
行业拐点,AI进入推理时代
中国工程院院士、清华大学智能产业研究院(AIR)创始院长张亚勤接受新华社采访时表示,人工智能要真正落地到各个领域,需要充足的算力支撑,这是当前及未来一二十年AI发展的主流方向。
当前,人工智能的发展重心正从“训练阶段”向“应用阶段”加速迈进,推理需求的爆发与算力成本的居高不下,正成为制约产业发展的核心痛点。
德勤在《2026科技、传媒和电信(TMT)行业预测》报告中指出,2026年推理算力在整体AI计算中的占比将达到66%,首次超过训练算力。这意味着推理从过去的技术配角,转变为决定AI商业化落地的核心主力。这一转变,在我们的日常生活中便能清晰感知——我们每天使用AI进行的每一次搜索、对话、内容生成的背后,都离不开推理算力的持续调用与Token的快速消耗。
然而,需求的爆发并未带来成本的优化,反而因现有算力架构的短板,让AI应用厂商陷入成本困境。据了解,目前行业内多数推理场景仍沿用训推一体芯片,这类产品以通用计算为设计思路,兼顾训练与推理需求,为了兼顾训练所需的高精度计算和海量数据吞吐,采用了昂贵的高级封装和HBM(高带宽内存)。这些组件推高了芯片成本和功耗,但在面对推理场景——尤其是低延迟、高并发、小批次的在线服务时,其庞大的算力往往利用率仅有5%到10%。这好比用一辆豪华越野车来跑网约车,看似全能,但真正上路载客时,油耗惊人、保养昂贵,在城市拥堵中更是施展不开。使用过程中极高的资源浪费和持有成本,最终将成为AI应用厂商的沉重负担,也阻碍了AI普惠发展的步伐。
推理GPU,重构算力成本底线
面对行业困局,国内GPU企业开始跳出国际巨头主导的“训推一体”主流技术路线,走出差异化的自主创新之路。曦望针对推理场景的核心需求开展底层架构定制化研发。自 2020 年完成首款芯片量产后,已完成三代产品的技术迭代。其 2020 年量产的第一代芯片启望 S1,为国内较早实现规模化落地的AI推理专用芯片,适配千余种计算机视觉模型,相关IP已对索尼、小米等大型企业授权;2023年推出的第二代芯片启望S2,通过自研通用GPU架构与指令集,在性能上对标行业头部产品,已完成 DeepSeek、Qwen 等国内主流大模型的适配工作;2026年初发布的第三代芯片启望S3,针对推理场景完成底层架构的全链路定制优化,结合LPDDR内存技术,在典型推理场景下,单位 Token推理成本较上一代产品大幅下降,并提出了“百万Token一分钱”的行业成本目标。
“只有把推理成本从元级降到分级,人工智能才有机会像水电一样成为普惠的基础设施。”曦望董事长徐冰的这一观点,也逐渐成为行业的普遍共识。在业内看来,算力成本每下探一个数量级,就意味着 AI 技术的应用门槛大幅降低,更多中小企业能够低成本接入 AI 能力,推动 AI 从实验室的 “技术示范”,真正走向千行百业的普惠赋能。
从“造好芯片”到“搭好平台”:算力服务的新逻辑
芯片的技术突破,只是国产算力突围的第一步。能否构建成熟完善、自主可控的产业生态,让国产芯片真正用得上、用得稳、用得广,才是决定国产算力产业长期竞争力的核心关键。
生态共建方面,行业已开展多维度的实践探索。曦望提出了共建 AI 推理平台的算力服务新模式,通过与商汤科技、范式智能等合作伙伴协同,面向大模型推理需求提供更加稳定、可预期的算力服务,推动算力资源转化为实际生产力;在产学研融合方面,其与浙江大学共建 “智能计算联合研发中心”,围绕半导体虚拟制造、人工智能科学计算等前沿领域开展联合攻关,推动实验室科研成果向工程化、产业化快速转化。2026 年 2 月 28 日,在杭州市争创全国人工智能创新发展第一城暨建设一流创新生态推进大会上,曦望高性能 GPU 及推理芯片研发项目,作为 12 个投资额超 10 亿元的人工智能领域重大项目之一完成签约落地,成为地方 AI 产业集群建设的重要组成部分。
从一颗芯片到一个平台,从技术突破到生态协同共建,国产 GPU 企业正以差异化的发展路径,不断突破技术壁垒、重构算力成本体系,为我国 AI 产业发展提供坚实的自主算力支撑。随着成本持续下探,服务网络日益完善,一个更加普惠、更富创造力的AI应用时代正在加速到来。





京公网安备 11011402013531号