当前位置: 首页 » 资讯 » 新科技 » 正文

马斯克最大算力中心建成了:全球首个GW级超算集群,再创世界纪录

IP属地 中国·北京 量子位 时间:2026-01-18 17:36:09

Jay 发自 凹非寺量子位 | 公众号 QbitAI

刚刚,全球首个GW级超算集群Colossus 2,正式投入运行

马斯克兴奋喊话:

这是全球首个达到1GW的超算集群,4月还将进一步升级至1.5GW。



网友直呼疯狂:「1.5GW,光是插座估计都得给墙壁装满了。」



有了这剂算力强心针,Grok的忠实拥趸已经提前开香槟,开始畅想Grok5的统治时代。



但在全网狂欢的背后,更多的人是苦不堪言——

2026年夏天,美国13个州的6700万居民,可能要因数据中心的存在被停电,没空调吹了。

全球首个GW级训练集群

老马的执行力太恐怖了。

不靠亚马逊,不靠微软,也没有「星际之门」计划,一己之力于孟菲斯平地建起一座1GW的超级超算集群。

前一代超算集群Colossus 1从无到有仅用了122天。

它配备约20万颗英伟达H100/H200和约3万颗英伟达GB200 NVL72。

而在此基础上翻了好几倍,功率达到1GW的Colossus 2,只花了仅仅不到一年。

1GW是什么概念?

一般来说,1GW可以为75万户家庭供电,轻松供电一整个旧金山。

一座核电站的功率差不多也就是1GW。

如果按马斯克所说,今年4月份,Colossus 2将升级至1.5GW,最终总装机容量达到2GW,这个数字将与美国大多数主要城市的用电量相当。

按照规划,彻底完工后的Colossus 2将内置55张GPU,远超meta的15万、微软10万,以及谷歌的分布式基础设施。

这庞大的资源,全部为Grok独自享用。

此前,曾有爆料称Grok 5的参数将达到惊人的6万亿左右,是Grok 4的两倍以上。

原因便是基于Colossus 2:

当时有观点认为Grok 5将在拥有数十万张英伟达GPU的Colossus 2上训练,耗电量约为1GW。



如今,Colossus 2已正式上线,1GW的条件也正正好好满足

而随着前段时间xAI E轮融资200亿美元的进账,Grok 5的Scaling筹码还在进一步增加。这意味着更大的模型参数,更快的训练速度、迭代速度,部署速度。

当OpenAI还在为2027年的算力基础设施发愁时,xAI已经把一座「城市级」AI 工厂开机运行,将Grok 5提前扶上了市场心目中的下一个SOTA。

正如网友所说,AI时代,速度就是最强的护城河。



居民受不了啦!

不过,并非所有人都因这种「速度」受益。

据《华尔街日报》消息,美国非营利电网运营商PJM,未来可能在极端高温或严寒天气期间,轮流对区域内的居民断电。

这意味着,美国13个州的6700万人,在今年不得不迎来一个相当难熬的夏天。

要说清楚这个问题,得先明白PJM是干嘛的。

PJM,简单来说就是美国能源系统的交通指挥中心,它根据实时用电需求,协调发电厂何时增发、何时降载,以维持供需平衡。

然而,大模型大力出奇迹的竞赛正在破坏这种平衡。

在数据中心建设热潮推动下,PJM预计未来10年电力需求将以年均4.8%的速度增长。

对一个多年需求变化不大的系统来说,这样的增速相当罕见。

一边需求激增,另一边,供给的增速却相当缓慢。新建电厂的速度甚至都跟不上老电厂的退役速度,电网容量面临饱和。

供需一旦出现偏差,电网频率就会波动,进而可能损坏发电厂等关键基础设施。

为避免这些风险,PJM只能两害相权取其轻,通过在用电高峰期轮流停电来卸压。

PJM也不是没想过其他办法。

去年9月,PJM发布了一系列提议,希望数据中心在高峰时段主动降低用电量,或改从其他渠道获取电力支持。

然而,亚马逊、谷歌、微软等几乎都表示了反对,认为这是对数据中心的歧视

值得一提的是,PJM主要负责美国东海岸地区,而xAI的Colossus位于中南部,并不在PJM电网覆盖范围内。

同时,为减少对当地电网的冲击,xAI还部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力缓冲,尽量避免周边居民遭遇停电。


[1]https://x.com/MilkRoadAI/status/2012558197240815665
[2]https://www.wsj.com/business/energy-oil/power-grid-ai-data-centers-1235f296

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。