DeepSeek-V3 & R1 合体，快手开源 "Auto Think" 大模型

IP属地中国·北京 编辑：任飞扬 IT之家 时间：2025-06-04 18:27:04

6 月 4 日消息，快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型，针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式，同时基于传统强化学习算法（GRPO），提出了带有过程监督的强化学习方法 Step-SRPO，以进一步提升模型在复杂任务中的表现。
据介绍，该模型融合了“思考”和“非思考”能力，号称“DeepSeek-V3 & R1 合体”，具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练，模型在多个“思考”和“非思考”评测榜单上均实现了性能提升，其中在部分代码和数学类的任务上，开启自动思考模式下的模型得分提升高达 20 分左右。官方表示，在部分榜单中，即使模型没有开启思考模式，受益于更优的推理形态，性能也有小幅上涨。
快手技术表示，Kwaipilot 未来将基于 preview 版本模型，进一步增强推理能力，支持更完善的思考中工具使用能力，也会将全部技术细节、训练方法开源。附模型开源地址：

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

大模型进展专栏第七期｜人工智能赋能科研范式重塑中国科学院 “磐石·科学基础大模型”

博通发布Jericho4芯片：台积电3nm工艺，可连接超100万颗处理器

中山医院获批国家人工智能应用中试基地建设项目，将打造医疗AI创新策源地

“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行多领域创新成果集中亮相

以科技引领产业，绘人工智能发展新篇

向新而行｜人工智能的“头雁”效应

全站最新

Palantir CEO怒怼“大空头”：做空英伟达和Palantir “简直是疯了”

京东上线自营秒送入口，新增专区跻身APP首页

又冷又有趣——蓝牙名字的秘密：居然和 10 世纪国王有关

又冷又有趣——二维码的自愈能力：被挡 1/4 还能扫

热门推荐

中东人工智能金融科技公司Alaan获4800万美元融资，助力企业智能化管理！

大模型进展专栏第七期｜人工智能赋能科研范式重塑中国科学院 “磐石·科学基础大模型”

博通发布Jericho4芯片：台积电3nm工艺，可连接超100万颗处理器

美国证券交易委员会成立人工智能专责小组助力创新与效率提升

伊利诺伊州立法禁止人工智能提供心理健康服务

中山医院获批国家人工智能应用中试基地建设项目，将打造医疗AI创新策源地

“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行多领域创新成果集中亮相

国家安全部：警惕人工智能“数据投毒”

“人工智能+”覆盖12个领域张家口人工智能应用场景加速落地

推动区域人工智能技术应用中科闻歌人工智能研发中心启用

以科技引领产业，绘人工智能发展新篇

向新而行｜人工智能的“头雁”效应

警惕人工智能数据污染：0.01%虚假文本可使有害输出增11.2%

库克：从未对苹果的产品规划感到如此兴奋

独家对话中国联通赵亚晖，AI时代的“数据燃料”是如何炼成的？ | 浪潮对话