当前位置: 首页 » 资讯 » 新科技 » 正文

DeepSeek论文登上《自然》杂志 首次披露训练R1成本

IP属地 中国·北京 编辑:冯璃月 TechWeb 时间:2025-09-18 10:25:07

9月18日消息,据外媒报道,AI初创公司DeepSeek(深度求索)的论文登上《自然》杂志。

DeepSeek表示其强大的AI模型R1的成功并非依赖于模仿其他大型语言模型(LLM)生成的示例进行训练,这一声明是随着R1模型的同行评审版本的发布而公布的。

论文描述了DeepSeek如何增强标准的大型语言模型以应对推理任务,其补充材料首次揭示了训练R1的成本:仅为29.4万美元。这不包括DeepSeek公司在开发R1所基于的基础LLM上花费的约600万美元,但总成本仍然远低于竞争对手模型被认为花费的数千万美元。

DeepSeek表示,R1主要使用英伟达的H800芯片进行训练。

R1被认为是第一个经过同行评审过程的主要LLM。“这是一个非常受欢迎的先例”,Hugging Face的机器学习工程师刘易斯·图恩斯特尔说,他审阅了《自然》杂志的论文。“如果我们没有公开分享这一过程的大部分内容,就很难评估这些系统是否构成风险。”

自1月发布以来,DeepSeek因其与世界领先的AI应用相比,竞争优势明显、成本低廉而备受赞誉和关注。Sensor Tower称,DeepSeek推出的应用在最初的18天内获得了1600万次下载,几乎是OpenAI的ChatGPT首次发布时900万次下载量的两倍。

公开资料显示,DeepSeek成立于2023年7月,由知名量化资管巨头幻方量化创立,专注于开发先进的大语言模型(LLM)和相关技术。幻方量化的掌门人梁文锋是DeepSeek的创始人。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。