当前位置：首页 » 资讯 » 新零售 » 正文

英伟达发布Llama-3.1-Nemotron-Ultra-253B-v1模型，推动AI高效部署

IP属地中国·北京 编辑：柳晴雪砍柴网 时间：2025-05-16 17:19:16

4月12日消息，科技媒体 marktechpost 昨日（4月11日）发布博文，报道称英伟达发布Llama-3.1-Nemotron-Ultra-253B-v1，这款2530亿参数的大型语言模型在推理能力、架构效率和生产准备度上实现重大突破。
随着AI在数字基础设施中的普及，企业与开发者需在计算成本、性能与扩展性间寻找平衡。大型语言模型（LLM）的快速发展提升了自然语言理解和对话能力，但其庞大规模常导致效率低下，限制大规模部署。
英伟达最新发布的Llama-3.1-Nemotron-Ultra-253B-v1（简称Nemotron Ultra）直面这一挑战，该模型基于meta的Llama-3.1-405B-Instruct架构，专为商业和企业需求设计，支持从工具使用到多轮复杂指令执行等任务。
IT之家援引博文介绍，Nemotron Ultra采用仅解码器的密集Transformer结构，通过神经架构搜索（NAS）算法优化，其创新之处在于采用跳跃注意力机制，在部分层中省略注意力模块或替换为简单线性层。
此外，前馈网络（FFN）融合技术将多层FFN合并为更宽但更少的层，大幅缩短推理时间，同时保持性能。模型支持128K token的上下文窗口，可处理长篇文本，适合高级RAG系统和多文档分析。
在部署效率上，Nemotron Ultra 也实现突破。它能在单8xH100节点上运行推理，显著降低数据中心成本，提升企业开发者的可及性。
英伟达通过多阶段后训练进一步优化模型，包括在代码生成、数学、对话和工具调用等任务上的监督微调，以及使用群体相对策略优化（GRPO）算法进行强化学习（RL）。这些步骤确保模型在基准测试中表现出色，并与人类交互偏好高度契合。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

全站最新

广汽风洞实验室跻身国家认可实验室行列

古尔曼：苹果基本已放弃了Mac Pro，M4 Ultra芯片也已被砍

微软打造自家最大量子研究机构，加码投资丹麦Lyngby设施

观察｜“好看第一位”和“安全是基础”冲突吗？雷军连发三博能否回答外界质疑？

热门推荐

放弃吧！“高速全面取消收费”根本没戏，免费只会更痛苦

八部门：进一步加大力度促进汽车消费促进汽车梯次消费、更新消费

新车难用满十年：技术短板、消费文化与行业策略如何共同“缩短”寿命

山东青岛：“微醺巴士”开拓文旅消费新场景

牛市就到这了？

拉布布暑期降温，中国潮玩出海弯道超车，谁是下一个顶流IP

南城香创始人汪国玉：平台消费券激发消费热情，门店收入利润均提升

通信企业：“推销热售后冷”消磨用户信任

盛银消金 25% 股权再被冻结！新董事长年初刚上任

伊利出席第八届中澳工商界首席执行官圆桌会助力中澳经贸合作提速升级

商查平台企业信息查询新范式：水滴信用企业查询MCP

从“闪购”到“观望”：Prime Day被拉长的背后，是消费者与平台的“双重博弈”

澎湃漫评｜通信企业为何“推销热售后冷”

“电商西进”助力豫企破浪：一枚鱼油的3000公里“暖心”之旅

京东外卖取消超时免单，改为“准时宝”服务