当前位置: 首页 » 资讯 » 新科技 » 正文

支付宝申请基于强化学习训练大语言模型专利,提高训练速度

IP属地 中国·北京 编辑:钟景轩 金融界 时间:2026-04-10 20:48:15

国家知识产权局信息显示,支付宝(杭州)数字服务技术有限公司申请一项名为“基于强化学习训练大语言模型的方法及装置”的专利,公开号CN121835810A,申请日期为2025年12月。

专利摘要显示,本说明书实施例提供一种训练大语言模型的方法及装置,针对当前的大语言模型,可以基于GRPO强化学习的框架,设置评测要点集,利用自身对其输出和评测要点集的各条评测要点进行比较,从而确定模型奖励。如此,可以不设置额外的奖励模型,从而无需外部请求,提高训练速度。另外,评测要点集可以多个评测要点,在根据评测要点集确定模型奖励过程中,可以按照输出数据与评测要点集的比较结果,融合为复合的奖励评价分数,根据奖励分数确定优化目标优化大语言模型,从而可以减缓奖励破解的问题。

天眼查资料显示,支付宝(杭州)数字服务技术有限公司,成立于2016年,位于杭州市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本10000万人民币。通过天眼查大数据分析,支付宝(杭州)数字服务技术有限公司共对外投资了12家企业,参与招投标项目67次,财产线索方面有商标信息92条,专利信息5000条,此外企业还拥有行政许可60个。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

市场资讯

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。