当前位置: 首页 » 资讯 » 新科技 » 正文

可重构芯片突围:清微智能RPU崛起,“后GPU”算力谁主沉浮

IP属地 中国·北京 环球网资讯 时间:2026-01-14 14:18:51

环球网

2026年初,AI芯片战场正悄然转向。

英伟达的焦虑:GPU遭遇“高阶TPU”挑战

当英伟达在CES上高调发布Rubin平台、宣称推理成本降至十分之一时,业内却更关注其背后的战略焦虑——就在一个多月前,meta被曝考虑弃用英伟达GPU、转投谷歌TPU;而就在2025年圣诞节,英伟达以200亿美元闪电收购Groq,一家估值仅69亿的初创公司,溢价近3倍。

Groq的核心武器,是其LPU(LinearProcessingUnit)——一种基于可重构数据流架构的新型AI加速器。它绕过传统GPU的内存墙,在大模型推理中实现几乎“确定性延迟”的Token吞吐,性能可达GPU的5–18倍,能效比提升10倍。

这场由TPU引发、由LPU加速的技术革命,正在催生一个新物种:高阶TPU(Advanced TPU)。而在中国,清微智能正成为这一路线的关键玩家。

2025年12月,北京AI芯片公司清微智能宣布完成超20亿元C轮融资,其自研的RPU(Reconfigurable Processing Unit)与Groq的LPU同属可重构数据流架构,被业内称为“中国版高阶TPU”。目前,清微已实现从IP、芯片到服务器的全栈自研,并在全国部署超3万张AI加速卡,稳居国产第一梯队。

其旗舰芯片TX81支持万亿参数大模型的训推一体,搭载该芯片的REX1032服务器可高效运行DeepSeekR1/V3等主流大模型,推理成本降低50%,能效比提升3倍。更关键的是,清微RPU已落地国家“东数西算”工程——新疆双河市中树云智算中心全部采用其芯片构建,成为西部绿色算力枢纽的标杆案例。


在生态层面,清微深度适配国产开源操作系统FlagOS,并与华为昇腾、寒武纪、昆仑芯、摩尔线程、海光等共同组成“FlagOS卓越适配单位”,覆盖GPU、ASIC与可重构三大技术路线。

三大技术流派成形:GPU、ASIC与可重构芯片三分天下

至此,2026年AI芯片三大技术流派至此可见端倪:一是GPU派,二是ASIC派,三是可重构数据流派。

GPU派,以英伟达、摩尔线程为代表,是当今AI芯片领域的绝对霸主。但GPU芯片的性能提升,非常依赖于半导体制程的极限突破,以及HBM带宽的艰难提升。当“内存墙”、高功耗等问题席卷而来,GPU为通用性付出的代价,让效率的进一步提升困难重重。

于是,就有了ASIC派,以谷歌TPU、寒武纪、百度昆仑芯为代表。ASIC架构,走的是一种“特种兵路线”。它是一种为特定算法深度定制的集成电路,通过将硬件与算法深度绑定,实现AI运算的极致能效。但ASIC的短板也很明显,一旦算法迭代,硬件难匹配,芯片就有过时、甚至被废的风险。那AI芯片,能不能既能实现高性能、低功耗,又能够根据算法变化,实现硬件灵活重构?

“可重构数据流派”正式登场。像Groq的LPU、清微智能的RPU,都属于这一派。它的核心,是“软件定义硬件”。也就是说,RPU内部的硬件资源,可通过软件指令、实时重组,所以像一条可以随时调整工序的智能流水线。这种兼具ASIC高效能和GPU灵活性的可重构芯片(RPU),又被称为芯片界的“变形金刚”。

它究竟有多强?以清微智能量产的TX81芯片为例。一台搭载可重构TX81芯片的AI训推一体服务器,就能搞定万亿参数大模型的部署。像REX1032训推一体服务器,单机支持DeepSeekR1/V3满血版推理,成本大降50%,能效比提升3倍。


从边缘到主流:可重构芯片加速向未来

所以2026年开年之际,三大技术流派的定位,突然尘埃落定:GPU派在训练和通用计算中虽然保持核心地位,但ASIC派,正用极致能效比,主攻特定模型的推理场景,让云厂商降本增效;而可重构数据流派,更以其灵活、高效、确定性,成为多元化AI芯片生态的重要力量。这个曾被国际半导体界誉为“未来最具前景的芯片架构”,正从细分走向主流,并成为头部企业争相布局的核心方向。

当英伟达开始“买下未来”,中国则选择“造出未来”。在这场决定下一代算力话语权的竞赛中,清微智能和它的RPU,或许正是中国打出的一张关键牌。(张阳)

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。