当前位置: 首页 » 资讯 » 新科技 » 正文

传说中的6G,挑头的居然不是高通而是英伟达

IP属地 中国·北京 硅星人 时间:2025-11-07 10:16:06


作者 | 郭海惟
邮箱 | guohaiwei@pingwest.com

Cloud is where AI is born;

Device is where AI acts;

Edge will be where AI lives。

如果要在GTC DC大会上,寻找一个英伟达身上最“性感”而非最“实感”的故事,不同人或许有不同的答案,但有一个技术品牌可能真的要新加入候选人名单了。正是为了它,英伟达刚刚花费了10亿美元入股了老牌电信厂商诺基亚。它就是英伟达AI-RAN的核心技术品牌:

Aerial。

Aerial,今天是一个带有点工业气息的词语。但词源来自拉丁语 aerius,意指“空气的、轻盈的、高耸的”,在古时也用来形容虚幻的、轻盈优雅的美。它让人联想起另一位硅谷“帮主”OpenAI的视频产品:

Sora。

Sora在日语中的本意是“空”,可以是天空,也可以是想象遥远地方时的一种心境。

无论英伟达还是OpenAI都把自己的旗舰产品指向天空,这不是一种偶然,也不仅是一种硅谷审美乐趣上的趋同。或许它们将讲述的是相似一个东西,但现在我们先暂时按下不表。

所谓AI-RAN,用大白话理解就是在通讯基站上加入算力,让未来海量的场景计算可以不用进入云,直接在基站计算完以后就能够返回给终端的场景设备。

这样的方式有两个最显而易见的好处:

一个是节省大量的传输成本,降低云算力中心的压力。

微软CEO萨提亚·纳德拉(Satya Nadella)在前两天与OpenAI CEO山姆·奥特曼(Sam Altman)对谈时就提到了这种AGI困境:他说他的仓库里还有GPU,但没有足够的算力中心容纳,也缺少足够的电力使用。那么其实AI-RAN把算力分布式地放在全球的各个基站里,就可以成为以上的解决方案之一。

第二个则是大幅降低算力的时延。

打过在线游戏的读者都知道,有50毫秒以内的时延都属于“流畅”,但如果把这个延迟复用到自动驾驶上,高速路上将到处都是被撞烂的废铁,这也是今天高精地图方案被边缘化的重要原因。但如果将算力中心推进到用户周围,那么延迟可以降低90%以上,从毫秒级变成微秒级,大量高时延要求的场景就会跑通了。

根据目前可考的公开资料,Aerial最早出现在英伟达的资料里是在2019年洛杉矶世界移动通信大会,那时它还只是一套SDK工具,目的是支持 GPU 加速与软件定义的 5G 无线接入网。

没错,2019年,正是“何同学”拍5G视频获得三千万播放量的梦幻之年。

所以从这个角度来说,Aerial大概也能算是一个“5G原生”的工具,正是通讯带宽的快速增长让英伟达看到了一个未来世界的影子,于是Aerial诞生了。

而在过去五年时间里,5G逐渐让不少人失望,但Aerial一直在默默发育。

在这期间,Aerial的定位脱离了最初的SDK工具箱的数据,而转变为一个为“产学研”服务的平台。

2021年3月,NVIDIA在IEEE的5G分论坛上发了一篇论文《NVIDIA Aerial GPU Hosted AI-on-5G》,介绍5G连接和移动边缘计算(MEC)的NVIDIA超融合(hyper-converged )平台,那时他们的案例目标是工业4.0。

在这篇论文的摘要里,NVIDIA明确表示:

Aerial是一个为研究人员提供下一代无线和人工智能研究平台,从而实现行业转型开放平台(As an open platform Aerial is positioned to be industry transformational by providing researchers with a platform for next generation wireless and AI research)。

一个月后,NVIDIA 在 2021 GTC 大会上推出 Aerial A100,即NVIDIA AI-on-5G 计算平台。

Aerial A100 其实是将,NVIDIA Aerial软件开发套件与 NVIDIA BlueField-2 A100芯片结合起来的产品,后者很大程度脱胎自是英伟达2020年刚完成收购的Mellanox的DPU产品线。虽然是这是一个拼凑起来的产品,一张包括了“5T FOR 5G”解决方案、集成GPU和DPU的融合型卡,但它为AI-RAN提供了宝贵的计算平台,得到了包括谷歌云、富士通的支持。

是的,他们甚至没有在名字里放入AI——所谓5T,指的是“时间触发传输技术”(Time-Triggered Transmission Technology for Telco)。顾名思义,这其实就是要解决精确时间戳和高时钟准确性的问题,但这其实是大规模边缘计算的基础。

有趣的是,而那年媒体对 2021 GTC 的标题是:“NVIDIA推出首款 CPU,狂推ARM生态。” 虽然服务器业务依然重要,但今天已经不太有人想起CPU了,更不会用ARM的视角来看待NVIDIA了。

随后Aerial迎来了一个小的高峰,这从英伟达的“技术博客”可见一斑,在2022年以后有体积Aerial的技术博客数量快速增加。


2022年到2023年间,英伟达陆续陆续推出的DOCA GPUNetIO 、Sionna 库、Aerial Research Cloud等一系列加速AI-RAN的工具。

DOCA GPUNetIO让GPU绕过CPU实现直连网络,降低了时延和成本、提高了吞吐量;

Sionna 库则是一个 GPU 加速的开源库,用于通信系统研究,官方说它可以实现“自动微分框架”,“通过整个通信系统反向传播梯度”,非常适合“神经网络集成”;

Aerial Research Cloud是第一个完全可编程的 5G 和 6G 网络研究沙盒。

但你依然可以将英伟达对Aerial做的所有事情,都重新回到2021年的那个论文标题上:

GPU Hosted AI-on-5G

2024年是英伟达Aerial的生态大年。

2月,著名的 AI-RAN Alliance 成立,牵头单位是英伟达和软银,其他创始单位分别是爱立信、诺基亚、三星、T-mobile、微软、AWS、Arm、DeepSig、美国东北大学。

AI-RAN Alliance成为了英伟达希望重新改写6G定义模式的重要一步,因为它囊括了(除了华为和中兴以外)几乎最重要的通信相关的公司。其组织目标就是要让AI与RAN结合,从而让6G变成真正的AI原生网络。

3月,英伟达还推出了包含 Omniverse 生态系统和 Aerial CUDA 的6G 研究平台。

而直到 9月份, 英伟达在GTC Paris 2024才宣布正式推出 NVIDIA AI Aerial。

这是它在官方介绍中,它已经成为了一个优化无线网络和提供全新生成式 AI 体验的一站式平台。

英伟达官方的通讯稿里是这样介绍 AI Aerial 的。

NVIDIA AI Aerial 平台提供了全套功能,包括高性能软件定义的 RAN 以及训练、模拟和推理,以便电信运营商能够参与下一代无线网络从开发到部署的所有阶段。

NVIDIA AI Aerial 平台提供的功能包括:

NVIDIA Aerial CUDA 加速 RAN:包含使合作伙伴能够在 NVIDIA 加速计算平台上开发和部署高性能虚拟化 RAN 工作负载的软件库。

NVIDIA Aerial AI 无线电框架:包含基于 PyTorch 和 TensorFlow 的软件库,用于开发和训练能够提高频谱效率并为 5G 和 6G 无线电信号处理添加新功能的模型。该框架还包含 NVIDIA Sionna,该链路级模拟器可用于开发和训练基于神经网络的 5G 和 6G 无线电算法。

NVIDIA Aerial Omniverse 数字孪生(AODT)是一个系统级网络数字孪生开发平台。AODT 能够以物理学精度模拟无线系统,无论是单个基站,还是由大量基站组成的覆盖整个城市的综合网络都不例外。它包含软件定义的 RAN(Aerial-CUDA 加速 RAN)和用户设备模拟器,以及物理世界的现实地形和物体属性。

这里包含了英伟达对下一个6G的很多定义和想象:

高性能的算力、神经网络的分布式网络能力、数字孪生的虚拟世界开发能力。

也从此开始,英伟达开始加速推进整个AI-RAN的生态建设的扩容,不仅与Vapor IO 这类边缘计算服务商在拉斯维加斯开辟实验田,也不断开源新的工具,推进新的头部合作伙伴。

而这一系列生态动作,在2025年10月的GTC DC大会上达到了一个阶段性的峰值。

1

Aerial 冲刺 CUDA 时刻

在10月GTC DC大会期间,英伟达终于对着 AI-RAN 暗流涌动的湖面上扔下了两个大石头:

第一,开源Aerial软件。

开源后的软件,将可以运行于包括 NVIDIA DGX Spark 在内的多种 NVIDIA 平台。

DGX Spark 就是黄仁勋之前亲手交付给马斯克和李在镕的小“便当盒子”,是目前全球最小的“AI超级电脑”,可以在本地执行最高 2000 亿参数的 AI 模型推理和 700 亿参数的模型微调,可以说完美匹配像AI-RAN场景多元的开发生态需求,非常适合高校研究者和个人开发者参与。


第二,英伟达宣布以10亿美金入股诺基亚,达成战略合作。

入股后英伟达将占比2.9%,英伟达的AI-RAN生态产品将进入诺基亚的RAN产品组合里,双方共同推进6G的AI-RAN落地。

第三,英伟达推出了 Aerial RAN Computer Pro (ARC-PRO)平台。

如果说曾经的 Aerial 平台还是一个带有研发起步性质的小平台,这次的ARC-PRO就是为顶级合作伙伴预备的产业级大跑道,它可以直接和基站结合,既能服务5G实现AI-RAN功能,还能帮助5G向6G的平滑过渡。介绍稿里的标题也从AI-RAN,正式切换成了“6G AI”。英伟达对这个6G AI平台的口气也变得很大,甚至在中国读者看来可能是很具有侵略性的:

“驱动美国重返电信领导地位”。

如果了解英伟达历史的读者,至此可能已经有一种似曾相识的感觉。 Aerial 的发展历程很像 CUDA,几乎是一种关于技术的商业美学复刻。

黄仁勋力推CUDA,因为它看到GPU不止局限于游戏图像,而有通用计算能力的潜力;推Aerial,因为RAN不止是通信,还可能是未来的AI基础设施。

CUDA从高校生态起步,花了十年时间培养,最终形成了独有的生态护城河;Aerial也是从小的研发性质开发平台起步,一步步变成一个AI-RAN生态,总共花了五年时间,成为了英伟达基站算力业务的护城河。

从单点工具 → 通用平台 → 生态护城河,这是英伟达与时间的经典故事。

但如果细究,则会发现两者在商业细节上不完全相同。

这种差别不是在节奏的快慢上,Aerial是含着金钥匙出身的孩子,节奏自然更快。最大的区别是英伟达对生态伙伴的态度上。

以算法生态为例,CUDA是闭源为主,Aerial是开源为主。

在合作方面,CUDA的开放主要是积累开发者的习惯和口碑,Aerial虽然也拥抱大量中小开发者,但核心战略目标直指生态中的顶级玩家。

英伟达若要复刻CUDA时刻,第一个“北极星指标”实际上是让自己的标准与生态被“大玩家”接受。没有通信行业错综复杂的利益生态的支持,AI-RAN就无从谈起。在通用计算方面,GPU对CPU是从无到有的降维打击。但Aerial对RAN则是从无到有的合作升维。

从这个角度来说,虽然贵为5万亿美金的硅谷新宠,在通信市场里,英伟达依然在扮演“仰攻”和“说服者”的角色。

“10亿美金入股”就是其中最有力的说服方式。

诺基亚可能是今天Aerial所能找到的最完美合作伙伴。

抛开华为外的欧美国家市场,诺基亚的5G基站市场份额已经落后爱立信,且在趋势上与后者的差距越来越大。尤其在美国的基站市场,诺基亚丢单Verizo以后,一度传出仅剩的T-Mobile也将不保。与英伟达的合作或许可以帮助诺基亚在美国市场重新站稳脚跟。

2023年,诺基亚出台过一个“2030年计划”。该计划与英伟达的喜好高度吻合,它将AI放在了所有战略的第一条,将“云连续体”放在了第二条。所谓云连续体,其实就是将“云-边-端”无缝融合,背后最大的市场机会其实就是“边缘云”市场。

而如果按照英伟达的技术构想,今天的通信公司未来都可以成为新的云计算公司。这点我们放在最后细说。

最后,诺基亚是一个股权分散的上市公司,大股东系芬兰政府旗下资金,不直接干预公司经营。因此,英伟达2.9%的持股,既不会过度引发其他基站公司的抵触和担忧,也能直接对诺基亚施加影响。

对于英伟达而言,入股诺基亚有两大战略优势。

第一,6G AI的部署速度会领先行业,假如英伟达率先将部署了Aerial的基站设备推向市场,再在Aerial基础上形成应用生态,率先做成生态的增长飞轮。

这有点像安卓之于塞班、Windows Mobile等系统,先发优势会形成操作系统的重要优势。

第二,则是关于传统RAN市场格局中非常重要的投票机制:3GPP。

3GPP是全球移动通信技术标准的核心制定组织,组织内有上百个不同产业链的关键企业。3GPP在中国算半个网红,因为它曾在几年前爆发过一个科技行业非常出圈的新闻,即华为主推的Polar码和高通主推的LDPC码的“投票门”。投票过程被花边演绎,结果对某投票的企业形成了极大的公关创伤。

其实像编码提案是需要71%的投票率通过,因此并不存在严格意义的“关键少数”,而是以技术共识为主、投票为辅的决策形式。但3GPP“权力修罗场”的形象已经被深刻留在了互联网里了。

英伟达虽然有AI-RAN作为行业联盟,但3GPP才是规则的制定者。坏消息是,由于没有传统的通信业务,英伟达在其中的权重很低,存在感很弱。所以英伟达也需要一个具有生态协同能力的策动能手,而诺基亚便是在3GPP中与华为、爱立信、高通并驾齐驱的第一梯队权重的投票者,对上下游的其他投票权企业也有很深的影响力。

而今年和明年的 3GPP 讨论 release 20 和 release 21 刚好是 5G 转向 6G 的重要节点。

其中2025年的 release 20 被认为是 5G-Advanced 的最后一站,也是迈向 6G 的第一站。而大概率在明年召开的 release 21 则将是 6G 标准的第一站。英伟达需要抓住更多的时间窗口,来为自己的 AI-RAN 生态获得更好的站位。


1

谁的“6G”?

英伟达是今天RAN生态不可忽视的变量,高通也是。

如果将 AI-RAN 粗暴地分成 AI 和 RAN 两个维度,再将二家半导体巨头放在一起比较:显然英伟达是 AI 强,RAN弱;高通则是 RAN 积累更深,AI 相对英伟达处下风。

在6G时代,高通当然也会是重要的参与者。但这涉及到一个话语权的重新争夺:

6G的本质到底是倾向于 AI 还是 RAN ?

最简单的做法是算账。

我们暂时无法给出准确的数据,但是有一些相近的数字可以参考。DGX Spark 128G 的定价是3999美元,折合人民币近3万元;算力中心的大芯片A100,大内存的单卡价格在1.5万美金往上,折合10万人民币。

5G基站方面,此前有媒体通过中国移动的总5G投资和总5G基站部署量,计算出整体的基站平均部署成本大约40万人民币(含安装、土地等综合成本)。不过近几年随着产业链成熟,5G基站成本也在快速下降,有相应集采价格已经跌到16万人民币。

不过5G基站的类型包含了大基站、微基站等不同种类大小,功率和覆盖范围差异很大,所以不能一概而论。但6G的基站相应会比5G更密集,大基站空间更少,微基站更多。不过早期技术普及期,整体价格也可能会高一些。

有两件事情是确定:

第一,芯片算力会在基站业务中占据非常重要的成本比例;

第二,这个成本占比在未来是存在弹性的:

如果算力的使用频率越高,场景对算力的需求就会越大,那么芯片在基站中的成本占比也就越高。换言之,相比于RAN业务的规模,算力芯片业务的收入想象可以是很宏大的。

而黄仁勋从来没有放弃过的东西,就是对算力“想象”。

这时我们就不得不搬出NVIDIA的另一个杀手锏级的技术品牌:

Ominverse。

这个产品曾经是元宇宙热潮时候的宠儿,名字也带着元宇宙的气息(Omni是“所有”的意思,连起来就是“全宇宙”)。2021年,黄仁勋用它做了一个数字分身做发布会演讲,成了 metaverse 时期的一道独特风景。


如今,meta 的时代已经远去,Omni 却留了下来。

今天Omnivesre成为了英伟达与场景的重要链接器,许多跟落地相关的业务都在这里。如果你想知道,算力将在未来改变哪些场景,最简单的方法就是直接看Omniverse的业务线。

比如这次2025GTC DC披露的重头戏自动驾驶业务,背后是Omniverse为主导的团队。

英伟达宣布将要在2027年前部署超过10万台自动驾驶车队,部署NVIDIA DRIVE AGX Hyperion 10 自动驾驶平台。这是除了特斯拉以外,目前最庞大的部署计划。

在L4期间,AI-RAN似乎不那么重要,但是L5几乎必须6G以上的AI-RAN网络支持。

因为L5意味着无方向盘的无人驾驶,要在所有路况、所有时间都能够稳定运行,而如此庞大的车流网络就必须要边缘算力支持、配合高精地图的全局规划能力。

L5自动驾驶对于AI-RAN是堪称教科书级别的场景,因为它满足了AI-RAN背后三个场景强烈的需求:

超高的低时延要求、端侧难以承载的算力要求、类似“群体智能”一般的AI算力调度能力。

马斯克在近期接受采访时,有个“大胆”的预言。

他说,“未来不会有操作系统,不会有APP,你的手机只是显示像素和发出声音,它预测你最想看到和听到什么,然后实时生成,我们会尽可能地将AI集成到这个设备中。

“不会再有传统意义上的手机了,我们所谓的手机,实际上是一个用于AI推理的边缘节点,配备一些无线电模块进行连接。”

而服务器端的AI会与用户设备(以前被称为手机)上的AI进行通信,并生成用户想要的任何实时视频。

马斯克观点的本质,其实是AI-RAN能力和大模型能力叠加,将取代所有的终端算力。算是最激进的一种AI-RAN的愿景,如果这个愿景实现,那么AI-RAN就是宇宙级的大生意。但许多研究机构都认同,在6G时代“云电脑”、“云手机”会从小众走向大众。而其中的“云”很可能就是AI-RAN能力加持的“边缘云”。人们不再需要花昂贵的价格占有设备,只需要在有高算力需求的时候租用即可。

不过我们如果回到现实,有两个场景是相对近在眼前的:

一个是机器人与XR设备。

目前所有的机器人都面临“端侧”对话太智障,但是“云”对话缓慢且昂贵的体验困境。智能眼镜厂商,面临的则是大算力芯片做不进小眼镜,小设备撑不起长续航的困境。但未来AI-RAN可能会成为潜在的解决方案。

一个是“元宇宙”级别的数字孪生场景。

无论是消费级的游戏应用,还是工业、手术台、能源、国防都可以做场景的延展。

今年3月,NVIDIA出过一个数字孪生平台,正是叫 Aerial Omniverse Digital Twin(AODT)。官方说,它可以实现从单个塔到城市规模的完整 6G 系统进行物理级准确的模拟。


读到这里,我猜你其实已经想到了AI-RAN的终局。

一个由边缘计算节点组建的超级计算机,一个地球ONLINE的超级服务器,一个AI打破世界的所有链接壁垒、又模糊掉所有边界的线上线下同构的世界。

当然,地球ONLINE还很遥远。但在此之前,你可能需要最后知道,AI-RAN可能还将改变两件事情:

一件是好的。

云服务器厂商的格局可能会变化,“边缘云”会从小众需求变成一件主流的超大生意,而通信服务商则可能会天然成为新的云服务商。下一个AWS,可能未必出自亚马逊。

一件是坏的。

如果你打开英伟达Aeiral页面,你会看到一个页面,写着:主权AI基础设施。

当然,算力原本也是脱敏的信息,但如果当5G通信网络都无法实现基站生意顺畅的跨国竞争。那么在AI-RAN时代,你可能更难以想象,欧美的政客会采用其他国家的基站设备。尽管华为可能是这个世界上,唯一既有AI芯片能力,又有基站能力的厂商。


这就是6G和它的AI。

它诞生在一个复杂的世界,所以也催生世界的复杂。


点个爱心,再走 吧

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新