当前位置: 首页 » 资讯 » 新科技 » 正文

英伟达发布Nemotron 3系列开源模型,支持亚马逊、谷歌等诸多云平台

IP属地 中国·北京 财闻 时间:2025-12-16 10:19:47

美东时间12月15日,英伟达(NVDA.US)官宣,推出 NVIDIA Nemotron 3 系列开源模型,并提供了帮助工程师使用这些模型的数据和工具。

据介绍,Nemotron 3模型分为三种规模:Nemotron 3 Nano 是一款小型 300 亿参数模型,一次最多可激活 30 亿个参数,用于执行有针对性的、高效的任务。Nemotron 3 Super 是一款高精度推理模型,拥有约 1000 亿个参数,每个令牌最多可有 100 亿个活动参数,适用于多智能体应用。Nemotron 3 Ultra 是一款大型推理引擎,拥有约 5000 亿个参数,每个令牌最多可激活 500 亿个参数,适用于复杂的 AI 应用。


英伟达官网

Nemotron 3 Nano现已上市,是目前计算成本最低的模型,针对软件调试、内容摘要、AI助手工作流程和信息检索等任务进行了优化,推理成本极低。该模型采用独特的混合MoE架构,显著提升了效率和可扩展性。与 Nemotron 2 Nano 相比,该设计实现了高达 4 倍的令牌吞吐量提升,并将推理令牌生成量减少了高达 60%,从而显著降低了推理成本。凭借 100 万个令牌的上下文窗口,Nemotron 3 Nano 能够记住更多信息,使其更加精准,并能更好地连接长时间、多步骤任务中的信息。

英伟达新发布的Nemotron 3模型在可下载、修改并在自有硬件上运行的模型中表现优异,基准测试成绩领先。包括埃森哲、Cadence、CrowdStrike、Cursor、德勤、安永、Oracle 云基础设施、Palantir、Perplexity、ServiceNow、西门子、Synopsys 和 Zoom 在内的早期采用者,正在整合 Nemotron 系列模型,以支持制造业、网络安全、软件开发、媒体、通信和其他行业的 AI 工作流程。

英伟达介绍,Nemotron 可在企业级 AI 和数据基础设施平台上使用,包括 Couchbase、DataRobot、H2O(HTO.US).ai、JFrog、Lambda 和 UiPath(PATH.US)。对于公有云客户,Nemotron 3 Nano 将通过 Amazon Bedrock 在 AWS 上提供,并且很快将支持 Google Cloud、CoreWeave(CRWV.US)、Crusoe、Microsoft Foundry、Nebius、Nscale 和 Yotta。

Nemotron 3 Nano 可作为NVIDIA NIM 微服务提供,可在 NVIDIA 加速的基础架构上的任何位置进行安全、可扩展的部署,从而最大限度地保护隐私和控制权。Nemotron 3 Super 和 Ultra 预计将于2026年上半年上市

值得关注的是,英伟达采取了比许多美国竞争对手更透明的策略,公开了训练Nemotron所用的数据,便于工程师对模型进行修改。公司还发布了支持定制和微调的工具,包括一种新的混合潜在专家混合模型架构(hybrid latent mixture-of-experts model architecture),据称特别适合构建能够在计算机或网络上执行操作的AI代理。此外,英伟达推出了允许用户通过强化学习(reinforcement learning)训练代理执行任务的库,该方法通过模拟奖励和惩罚来训练模型。

英伟达CEO黄仁勋在发布前表示:“开放创新是AI进步的基础。通过Nemotron,我们将先进AI转变为一个开放平台,为开发者提供构建大规模自主系统所需的透明度和效率。”

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新