当前位置：首页 » 资讯 » 新科技 » 正文

Kimi K2模型测试：英伟达GB200 NVL72性能较HGX 200提升10倍

IP属地中国·北京 IT之家 时间：2025-12-04 12:19:00

IT之家 12 月 4 日消息，科技媒体 Wccftech 昨日（12 月 3 日）发布博文，报道称在“混合专家”模型上，英伟达的 GB200 NVL72 AI 服务器取得重大性能突破。
基于开源大语言模型 Kimi K2 Thinking、Deepseek-R1-0528、Mistral Large 3 测试，相比上一代 Hopper HGX 200 性能提升 10 倍。

IT之家注：混合专家模型（MoE）是一种高效的 AI 大模型架构。它不像传统模型那样在处理每个任务时都动用全部“脑力”（参数），而是像一个专家团队，根据任务类型只激活一小部分最相关的“专家”（参数子集）来解决问题。这样做能显著降低计算成本，提高处理速度。

就像人脑使用特定区域执行不同任务一样，混合专家模型使用路由器来选择最相关的专家来生成每个 token。

自 2025 年初以来，几乎所有领先的前沿模型都采用 MoE 设计
英伟达为了解决 MoE 模型扩展时遇到的性能瓶颈，采用了“协同设计”（co-design）的策略，该方法整合了 GB200 的 72 芯片配置、高达 30TB 的快速共享内存、第二代 Transformer 引擎以及第五代 NVlink 高速互联技术。
通过这些技术的协同工作，系统能够高效地将 Token 批次拆分并分配到各个 GPU，同时以非线性速率提升通信量，从而将专家并行计算（expert parallelism）提升至全新水平，最终实现了性能的巨大飞跃。
除了硬件层面的协同设计，英伟达还实施了多项全栈优化措施来提升 MoE 模型的推理性能。例如，NVIDIA Dynamo 框架通过将预填充（prefill）和解码（decode）任务分配给不同的 GPU，实现了任务的解耦服务，允许解码阶段以大规模专家并行方式运行。

同时，系统还采用了 NVFP4 格式，这种数据格式在保持计算精度的同时，进一步提高了性能和效率，确保了整个 AI 计算流程的高效稳定。
该媒体指出，此次 GB200 NVL72 取得的性能突破，对英伟达及其合作伙伴具有重要意义。这一进展成功克服了 MoE 模型在扩展时面临的计算瓶颈，从而能够满足日益增长的 AI 算力需求，并巩固了英伟达在 AI 服务器市场的领先地位。

GB200 NVL72，图源：英伟达

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

腾讯元宝日活超5000万，月活1.14亿

英伟达美股盘前涨近2%

印度首届大规模人工智能峰会，高校买中国机器狗冒充“自主研发”被要求撤离

沃伦·巴菲特在退休前最后一季清仓亚马逊、苹果和美国银行股票

村里人如何用AI？月嫂用AI发朋友圈，千问成了大爷的赛博收音机

魔法原子机器人“霸屏”春晚，具身智能资本风向生变

全站最新

腾讯元宝日活超5000万，月活1.14亿

英伟达美股盘前涨近2%

印度首届大规模人工智能峰会，高校买中国机器狗冒充“自主研发”被要求撤离

沃伦·巴菲特在退休前最后一季清仓亚马逊、苹果和美国银行股票

热门推荐

腾讯元宝日活超5000万，月活1.14亿

1.25元的水饺、四五十元的烤鸭，和被平台“一键剥夺”的定价权

AI“军备竞赛”，亚马逊输不起的战争

地方两会时间，文旅成了主角

卖一辆亏一辆？返利兑现账期超180天，奔驰经销商进退两难

旅游业复苏还赚不到钱，中青旅开始怪老天爷

英伟达美股盘前涨近2%

当“飞机发动机”成为“数据中心供电”标的

印度首届大规模人工智能峰会，高校买中国机器狗冒充“自主研发”被要求撤离

沃伦·巴菲特在退休前最后一季清仓亚马逊、苹果和美国银行股票

村里人如何用AI？月嫂用AI发朋友圈，千问成了大爷的赛博收音机

魔法原子机器人“霸屏”春晚，具身智能资本风向生变

外包商系统遭黑客入侵，沃尔沃集团近1.7万名北美员工资料外泄

视频 | 模速空间里，在上海“反向过年”的AI大模型开发者

追觅推出自带线165W带屏移动电源：2C+1A，399元