上个月有报道称,英伟达新款中国特供版计算卡的型号可能是“B30”,基于Blackwell架构芯片打造,估计定价在6500美元至8000美元之间,远低于远低于H20的1万美元至1.2万美元。其可能通过ConnectX-8 SuperNIC连接,利用PCIe 6.0交换机,满足GPU到GPU的通信需求,并非大家所认为的NVlink来实现“多GPU扩展”功能。
据Wccftech报道,来自某间中国的互联网公司估算,新款中国特供版计算卡B30的性能约为H20的75%,其已经在6月下旬下单了数十万块,订单总金额达到了10亿美元,预计8月开始交付。
传闻英伟达希望今年末之前能出货数百万块B30计算卡,速度变慢主要原因是使用GDDR7代替了过去的HBM模块,另外还有一些技术上的削弱。即便性能下降,中国市场的需求仍然是巨大的,大家都在寻找一种具有成本效益的推理解决方案,因为模型训练阶段已经用以前的AI芯片完成了,比如H100计算卡。B30也能用于中小型机型,对于中国庞大的用户群体来说,新款产品可以为客户提供低成本计算的选择。
围绕B30构建的机架级解决方案性能不但更高,而且更高的成本效益可能会更具吸引力,预计B30的能效比起H20会高出30%,采购成本低40%。虽然暂时还不清楚B30的细节,但是很明显,英伟达瞄准了中国更广阔的人工智能市场,推出针对性的设计。