当前位置：首页 » 资讯 » 新科技 » 正文

DeepSeek论文登上《自然》杂志首次披露训练R1成本

IP属地中国·北京 编辑：冯璃月 TechWeb 时间：2025-09-18 10:25:07

9月18日消息，据外媒报道，AI初创公司DeepSeek（深度求索）的论文登上《自然》杂志。
DeepSeek表示其强大的AI模型R1的成功并非依赖于模仿其他大型语言模型（LLM）生成的示例进行训练，这一声明是随着R1模型的同行评审版本的发布而公布的。
论文描述了DeepSeek如何增强标准的大型语言模型以应对推理任务，其补充材料首次揭示了训练R1的成本：仅为29.4万美元。这不包括DeepSeek公司在开发R1所基于的基础LLM上花费的约600万美元，但总成本仍然远低于竞争对手模型被认为花费的数千万美元。
DeepSeek表示，R1主要使用英伟达的H800芯片进行训练。
R1被认为是第一个经过同行评审过程的主要LLM。“这是一个非常受欢迎的先例”，Hugging Face的机器学习工程师刘易斯·图恩斯特尔说，他审阅了《自然》杂志的论文。“如果我们没有公开分享这一过程的大部分内容，就很难评估这些系统是否构成风险。”
自1月发布以来，DeepSeek因其与世界领先的AI应用相比，竞争优势明显、成本低廉而备受赞誉和关注。Sensor Tower称，DeepSeek推出的应用在最初的18天内获得了1600万次下载，几乎是OpenAI的ChatGPT首次发布时900万次下载量的两倍。
公开资料显示，DeepSeek成立于2023年7月，由知名量化资管巨头幻方量化创立，专注于开发先进的大语言模型（LLM）和相关技术。幻方量化的掌门人梁文锋是DeepSeek的创始人。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

机器人伴侣来了！10天预售3800台搭载养成系情感大模型

SpaceX历史性IPO后，马斯克称将深化与英伟达的关系

今夜过后，马斯克成为人类首位万亿富翁

萝卜快跑在瑞士启动道路测试 2027年将实现常态化运营

Anthropic：最先进模型，外国人禁用

网传阿里合伙人周靖人拟离职，仅出任阿里首席科学家6天

人物 | 陈宇森，那个让AI管人的技术极客，开启钉钉新时代

雷军用小米YU7装120箱车厘子共600斤，被指违规！刚刚直播回应：是卡车送过来的，是在封闭道路分装

湾区“造芯”更“追光”，粤芯闯关创业板

苹果为折叠屏iPhone Ultra铺路：iOS 27新增多款原生应用横屏模式

华为鸿蒙NEXT座舱发布计划公布，预计年底商用

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

DeepSeek论文登上《自然》杂志首次披露训练R1成本

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

DeepSeek论文登上《自然》杂志 首次披露训练R1成本

同类资讯

DeepSeek论文登上《自然》杂志首次披露训练R1成本