DeepSeek-R1-0528更新了什么？官方公布细节了

IP属地中国·北京 编辑：任飞扬手机中国 时间：2025-05-29 22:32:07

近日，DeepSeek R1模型迎来重要升级，最新版本DeepSeek-R1-0528正式发布。此次更新通过强化后训练过程，显著提升了模型的思维深度与推理能力，在多个领域展现出更优异的性能。
在深度思考能力方面，DeepSeek-R1-0528以2024年12月发布的DeepSeek V3 base模型为基座，投入更多算力进行优化。这使得新模型在数学、编程和通用逻辑等多个基准测评中表现卓越，成绩位居国内模型前列，并接近国际顶尖水平，如o3与Gemini-2.5-Pro。特别是在AIME 2025测试中，新版模型的准确率从旧版的70%提升至87.5%，显示出在复杂推理任务中的显著进步。这一提升得益于模型在解题过程中进行了更为详尽和深入的思考，平均每题使用的tokens从12K增加到23K。
除了深度思考能力的提升，DeepSeek-R1-0528还在其他方面进行了优化。针对“幻觉”问题，新模型在改写润色、总结摘要、阅读理解等场景中的幻觉率降低了45%～50%，提供了更为准确、可靠的结果。在创意写作方面，新模型针对议论文、小说、散文等文体进行了优化，能够输出篇幅更长、结构更完整的长篇作品，且风格更贴近人类偏好。
此外，DeepSeek-R1-0528还支持工具调用功能，尽管不支持在thinking中进行工具调用，但在Tau-Bench测评中表现良好，与OpenAI o1-high相当。同时，新模型在前端代码生成、角色扮演等领域的能力也有所提升。
API方面，DeepSeek-R1-0528已同步更新，接口与调用方式保持不变，但增加了Function Calling和JsonOutput的支持。官方还调整了max_tokens参数的含义，用于限制模型单次输出的总长度，包括思考过程。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

大模型进展专栏第七期｜人工智能赋能科研范式重塑中国科学院 “磐石·科学基础大模型”

博通发布Jericho4芯片：台积电3nm工艺，可连接超100万颗处理器

中山医院获批国家人工智能应用中试基地建设项目，将打造医疗AI创新策源地

“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行多领域创新成果集中亮相

以科技引领产业，绘人工智能发展新篇

向新而行｜人工智能的“头雁”效应

全站最新

京东JoyAI数字人大模型再进化，自由态数字人开放给商家抢先体验

霸州小红书短视频代运营公司哪家好？口碑推荐top5

推理变得比训练更重要：阿里 AI 调整背后的技术趋势

银华互联网主题灵活配置混合A：2025年利润4628.91万元净值增长率80.63%

热门推荐

中东人工智能金融科技公司Alaan获4800万美元融资，助力企业智能化管理！

大模型进展专栏第七期｜人工智能赋能科研范式重塑中国科学院 “磐石·科学基础大模型”

博通发布Jericho4芯片：台积电3nm工艺，可连接超100万颗处理器

美国证券交易委员会成立人工智能专责小组助力创新与效率提升

伊利诺伊州立法禁止人工智能提供心理健康服务

中山医院获批国家人工智能应用中试基地建设项目，将打造医疗AI创新策源地

“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行多领域创新成果集中亮相

国家安全部：警惕人工智能“数据投毒”

“人工智能+”覆盖12个领域张家口人工智能应用场景加速落地

推动区域人工智能技术应用中科闻歌人工智能研发中心启用

以科技引领产业，绘人工智能发展新篇

向新而行｜人工智能的“头雁”效应

警惕人工智能数据污染：0.01%虚假文本可使有害输出增11.2%

库克：从未对苹果的产品规划感到如此兴奋

独家对话中国联通赵亚晖，AI时代的“数据燃料”是如何炼成的？ | 浪潮对话