环球网
2026年初,AI芯片战场正悄然转向。
英伟达的焦虑:GPU遭遇“高阶TPU”挑战
当英伟达在CES上高调发布Rubin平台、宣称推理成本降至十分之一时,业内却更关注其背后的战略焦虑——就在一个多月前,meta被曝考虑弃用英伟达GPU、转投谷歌TPU;而就在2025年圣诞节,英伟达以200亿美元闪电收购Groq,一家估值仅69亿的初创公司,溢价近3倍。
Groq的核心武器,是其LPU(LinearProcessingUnit)——一种基于可重构数据流架构的新型AI加速器。它绕过传统GPU的内存墙,在大模型推理中实现几乎“确定性延迟”的Token吞吐,性能可达GPU的5–18倍,能效比提升10倍。
这场由TPU引发、由LPU加速的技术革命,正在催生一个新物种:高阶TPU(Advanced TPU)。而在中国,清微智能正成为这一路线的关键玩家。
2025年12月,北京AI芯片公司清微智能宣布完成超20亿元C轮融资,其自研的RPU(Reconfigurable Processing Unit)与Groq的LPU同属可重构数据流架构,被业内称为“中国版高阶TPU”。目前,清微已实现从IP、芯片到服务器的全栈自研,并在全国部署超3万张AI加速卡,稳居国产第一梯队。
其旗舰芯片TX81支持万亿参数大模型的训推一体,搭载该芯片的REX1032服务器可高效运行DeepSeekR1/V3等主流大模型,推理成本降低50%,能效比提升3倍。更关键的是,清微RPU已落地国家“东数西算”工程——新疆双河市中树云智算中心全部采用其芯片构建,成为西部绿色算力枢纽的标杆案例。
![]()
在生态层面,清微深度适配国产开源操作系统FlagOS,并与华为昇腾、寒武纪、昆仑芯、摩尔线程、海光等共同组成“FlagOS卓越适配单位”,覆盖GPU、ASIC与可重构三大技术路线。
三大技术流派成形:GPU、ASIC与可重构芯片三分天下
至此,2026年AI芯片三大技术流派至此可见端倪:一是GPU派,二是ASIC派,三是可重构数据流派。
GPU派,以英伟达、摩尔线程为代表,是当今AI芯片领域的绝对霸主。但GPU芯片的性能提升,非常依赖于半导体制程的极限突破,以及HBM带宽的艰难提升。当“内存墙”、高功耗等问题席卷而来,GPU为通用性付出的代价,让效率的进一步提升困难重重。
于是,就有了ASIC派,以谷歌TPU、寒武纪、百度昆仑芯为代表。ASIC架构,走的是一种“特种兵路线”。它是一种为特定算法深度定制的集成电路,通过将硬件与算法深度绑定,实现AI运算的极致能效。但ASIC的短板也很明显,一旦算法迭代,硬件难匹配,芯片就有过时、甚至被废的风险。那AI芯片,能不能既能实现高性能、低功耗,又能够根据算法变化,实现硬件灵活重构?
“可重构数据流派”正式登场。像Groq的LPU、清微智能的RPU,都属于这一派。它的核心,是“软件定义硬件”。也就是说,RPU内部的硬件资源,可通过软件指令、实时重组,所以像一条可以随时调整工序的智能流水线。这种兼具ASIC高效能和GPU灵活性的可重构芯片(RPU),又被称为芯片界的“变形金刚”。
它究竟有多强?以清微智能量产的TX81芯片为例。一台搭载可重构TX81芯片的AI训推一体服务器,就能搞定万亿参数大模型的部署。像REX1032训推一体服务器,单机支持DeepSeekR1/V3满血版推理,成本大降50%,能效比提升3倍。
![]()
从边缘到主流:可重构芯片加速向未来
所以2026年开年之际,三大技术流派的定位,突然尘埃落定:GPU派在训练和通用计算中虽然保持核心地位,但ASIC派,正用极致能效比,主攻特定模型的推理场景,让云厂商降本增效;而可重构数据流派,更以其灵活、高效、确定性,成为多元化AI芯片生态的重要力量。这个曾被国际半导体界誉为“未来最具前景的芯片架构”,正从细分走向主流,并成为头部企业争相布局的核心方向。
当英伟达开始“买下未来”,中国则选择“造出未来”。在这场决定下一代算力话语权的竞赛中,清微智能和它的RPU,或许正是中国打出的一张关键牌。(张阳)





京公网安备 11011402013531号