当前位置: 首页 » 资讯 » 新科技 » 正文

宁波深擎申请语言模型工具调用专利,提升大语言模型工具调用的识别准确率和泛化性

IP属地 中国·北京 编辑:王婷 金融界 时间:2024-09-26 15:41:52

2024年9月26日消息,国家知识产权局信息显示,宁波深擎信息科技有限公司申请一项名为“语言模型工具调用方法、装置、计算机设备和存储介质”的专利,公开号 CN 118690853 A,申请日期为2024年7月。

专利摘要显示,本发明涉及一种语言模型工具调用方法、装置、计算机设备和存储介质。所述方法包括:构建语言模型微调的训练数据;训练数据包括提示语句、本地函数库、问题集和答案集;问题集作为训练数据中用户角色的输入,答案集中标注的函数名称和参数、提示语句以及本地函数库的子集作为训练数据中助手角色的输入,答案集中标注的函数调用返回作为训练数据中工具角色的输入;使用训练数据对语言模型进行微调训练;其中,微调训练时,语言模型在反向传播中不计算用户角色和工具角色的损失值;采用完成微调训练的语言模型根据用户输入的问题进行推理,得到需要调用的目标函数工具。采用本方法可以提升大语言模型工具调用的识别准确率和泛化性。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。