当前位置: 首页 » 资讯 » 新科技 » 正文

英伟达4B小模型逆袭!单任务成本竟是 GPT-5 Pro 的 1/36

IP属地 中国·北京 编辑:苏婉清 Chinaz 时间:2025-12-08 16:16:56

在人工智能领域,最近发生了一场激烈的竞争。英伟达的4B 小模型 NVARC 在最新的 ARC-AGI2评测中以27.64% 的优异成绩力压对手 GPT-5Pro 的18.3%,成功登顶。这一成就不仅展示了 NVARC 的强大性能,其每个任务的成本仅为20美分,远低于 GPT-5Pro 的7美元,成本比拼中简直是 “性价比之王”。

NVARC 的成功有赖于其独特的零预训练深度学习方法。这一策略避免了传统大规模通用数据集的预训练所带来的领域偏见和数据依赖问题。这次评测尤其挑战性十足,ARC-AGI2采取了更高难度的测试,旨在考察模型能否在没有直接训练数据的情况下,快速学习并掌握新技能。

英伟达团队为 NVARC 的训练采取了一种创新思路。他们将复杂的推理过程移至离线的合成数据管道,使用 GPT-OSS-120B 生成高质量的合成谜题,从而降低实时计算资源的需求。团队从现有的数据集中提取问题,并通过组合生成更复杂的新题目。为了确保生成数据的高质量,他们将推理过程分解为多个独立验证的阶段,最终形成了一个包含320万条增强样本的大型合成数据集。

NVARC 在推理模块中采用了改进版的 ARChitects 方法,并通过对话式模板简化了谜题理解。在训练过程中,他们还利用 NeMo RL 框架和 Megatron 后端进行监督微调。特别值得注意的是,针对每个任务进行微调的 TTFT 技术,使得模型能够快速适应新的任务规则。

尽管有人可能会质疑这种小模型是否只是一台 “做题机器”,但 NVARC 的成功实际上凸显了其在特定领域内的强大适应能力和效率。小模型在成本、速度和适配性方面的优势,使其在许多应用场景中显得尤为重要。未来,如何将正确的方法应用于合适的领域,将是推动技术进一步发展的关键。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。