当前位置：首页 » 资讯 » 新科技 » 正文

英伟达发布“行业最高效”Nemotron 3开源AI模型系列

IP属地中国·北京 IT之家 时间：2025-12-16 00:14:55

IT之家 12 月 15 日消息，英伟达今日发布 Nemotron 3 开源模型系列，包括 Nano、Super 和 Ultra 三种规格，宣称是构建 AI 智能体应用时“具有最佳准确性的最高效开源模型家族”。

Nemotron 3 系列模型宣称引入了一种突破性的混合潜在专家（MoE）架构，帮助开发者大规模构建和部署可靠的多智能体系统。
英伟达表示，随着组织从单一模型聊天机器人转向协作式的多智能体 AI 系统，开发者面临着越来越多的挑战，包括通信开销、上下文漂移和高昂的推理成本。此外，开发者需要透明度来信任那些将自动化其复杂工作流程的模型。Nemotron 3 直接应对这些挑战，提供客户所需的表现力和开放性，以构建专门化的智能体 AI。
早期采用者包括安永、思科、Oracle Cloud Infrastructure、Palantir、Perplexity、ServiceNow、西门子、Synopsys、Zoom、Accenture、Cadence 和 Cursor，正在将 Nemotron 家族的模型集成到 AI 工作流中，以推动制造业、网络安全、软件开发、媒体、通信等行业的应用。
开放的 Nemotron 3 模型使初创公司能够更快地构建和迭代 AI 智能体，并加速从原型到企业部署的创新。
IT之家从英伟达官方获悉，Nemotron 3 的 MoE 模型系列包括三种规格：
Nemotron 3 Nano，一款小型的 30-billion-parameter 模型，每次激活最多 30 亿参数，适用于针对性强、高度高效的任务。Nemotron 3 Super，一款高准确性的推理模型，拥有约 1000 亿参数，每个 token 最多激活 100 亿参数，适用于多智能体应用。Nemotron 3 Ultra 是一款拥有约 5000 亿参数和每 token 最多 500 亿活跃参数的大型推理引擎，适用于复杂的 AI 应用。
Nemotron 3 Nano 宣称是目前计算成本效率最高的模型，专为软件调试、内容摘要、AI 助手工作流程和低推理成本的信息检索等任务进行优化。该模型相比 Nemotron 2 Nano 实现了高达 4 倍的 token 处理吞吐量，并将推理 token 生成减少了 60%，显著降低了推理成本。凭借 100 万 token 的上下文窗口，Nemotron 3 Nano 能记住更多信息，使其在处理长时间、多步骤任务时更加准确且具备更强的信息关联能力。
Nemotron 3 Nano 今日已在 Hugging Face 上线，Nemotron 3 Super 和 Ultra 预计将在 2026 年上半年推出。IT之家附开源地址：

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

耶鲁研究：AGI 时代，人类工作不会大面积消失

英伟达 AI 纹理压缩技术：显存占用降 85%，画质无损

特斯拉D3芯片亮相，专为太空算力设计

“龙虾”再曝安全漏洞！如何做好安全防护？专家支招

谷歌发布Gemma 4开源大模型，称其为迄今为止谷歌最智能模型

马斯克曾做出颠覆性预言：20年内的攒钱养老，将变得“毫无意义”

全站最新

耶鲁研究：AGI 时代，人类工作不会大面积消失

英伟达 AI 纹理压缩技术：显存占用降 85%，画质无损

特斯拉D3芯片亮相，专为太空算力设计

“龙虾”再曝安全漏洞！如何做好安全防护？专家支招

热门推荐

耶鲁研究：AGI 时代，人类工作不会大面积消失

英伟达 AI 纹理压缩技术：显存占用降 85%，画质无损

沙特借助美国载人绕月任务发射一颗卫星

新型AI模型可通过血检识别多种神经退行性疾病

特斯拉D3芯片亮相，专为太空算力设计

“龙虾”再曝安全漏洞！如何做好安全防护？专家支招

谷歌发布Gemma 4开源大模型，称其为迄今为止谷歌最智能模型

马斯克曾做出颠覆性预言：20年内的攒钱养老，将变得“毫无意义”

2026年小程序模板平台优选指南：深度评测对比

能赚超额收益的3个AI赛道

OPPO Find X9s Pro银色哈苏专业增距镜亮相：观赛神器颜值拉满

未来人类X98W移动“工作站”笔记本电脑上线官网，4月内发售

超越苹果影像！荣耀Magic9系列10月见首款阿莱影像商务旗舰

英特尔推出酷睿Ultra 7 251HX处理器：6P + 12E + 3Xe

让创新始于“零”点：长三角科研院所如何在产业深处提炼最优解？