当前位置: 首页 » 资讯 » 新科技 » 正文

曦望新一代推理GPU芯片启望S3发布:单位Token推理成本降低90%

IP属地 中国·北京 IT之家 时间:2026-01-27 20:56:48

IT之家 1 月 27 日消息,据界面新闻报道,国产 GPU 厂商曦望(Sunrise)发布了新一代推理 GPU 芯片启望 S3。这是该公司在近一年累计完成约 30 亿元战略融资后的首次集中公开亮相。


据IT之家了解,启望 S3 是一款面向大模型推理的定制化 GPGPU 芯片。据了解,该芯片在典型推理场景下的整体性价比较上一代产品提升超过 10 倍。算力与存储设计上,芯片支持 FP16 至 FP4 精度切换,采用 LPDDR6 显存方案,显存容量较上一代提升 4 倍。

在应用层面,启望 S3 在 DeepSeek V3/R1 满血版等主流大模型推理场景中,单位 Token 成本较上一代降低约 90%。

曦望还同步发布了面向大模型推理的寰望 SC3-256 超节点方案,可适配千亿、万亿级参数的多模态 MoE 推理场景。此外,曦望还联合商汤科技、第四范式等生态伙伴,共同发起“百万 Token 一分钱”推理成本计划。曦望与浙江大学签署战略合作协议,联合成立“智能计算联合研发中心”。

曦望前身是商汤科技大芯片部门,不久前宣布在一年内完成了近 30 亿元战略融资。2025 年,曦望芯片交付量已突破万片。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。