当前位置: 首页 » 资讯 » 新零售 » 正文

DeepSeek-R1-0528更新了什么?官方公布细节了

IP属地 北京 编辑:任飞扬 手机中国 时间:2025-05-29 22:32:07

近日,DeepSeek R1模型迎来重要升级,最新版本DeepSeek-R1-0528正式发布。此次更新通过强化后训练过程,显著提升了模型的思维深度与推理能力,在多个领域展现出更优异的性能。

在深度思考能力方面,DeepSeek-R1-0528以2024年12月发布的DeepSeek V3 base模型为基座,投入更多算力进行优化。这使得新模型在数学、编程和通用逻辑等多个基准测评中表现卓越,成绩位居国内模型前列,并接近国际顶尖水平,如o3与Gemini-2.5-Pro。特别是在AIME 2025测试中,新版模型的准确率从旧版的70%提升至87.5%,显示出在复杂推理任务中的显著进步。这一提升得益于模型在解题过程中进行了更为详尽和深入的思考,平均每题使用的tokens从12K增加到23K。

除了深度思考能力的提升,DeepSeek-R1-0528还在其他方面进行了优化。针对“幻觉”问题,新模型在改写润色、总结摘要、阅读理解等场景中的幻觉率降低了45%~50%,提供了更为准确、可靠的结果。在创意写作方面,新模型针对议论文、小说、散文等文体进行了优化,能够输出篇幅更长、结构更完整的长篇作品,且风格更贴近人类偏好。

此外,DeepSeek-R1-0528还支持工具调用功能,尽管不支持在thinking中进行工具调用,但在Tau-Bench测评中表现良好,与OpenAI o1-high相当。同时,新模型在前端代码生成、角色扮演等领域的能力也有所提升。

API方面,DeepSeek-R1-0528已同步更新,接口与调用方式保持不变,但增加了Function Calling和JsonOutput的支持。官方还调整了max_tokens参数的含义,用于限制模型单次输出的总长度,包括思考过程。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。