2024年9月26日消息,国家知识产权局信息显示,宁波深擎信息科技有限公司申请一项名为“语言模型工具调用方法、装置、计算机设备和存储介质”的专利,公开号 CN 118690853 A,申请日期为2024年7月。
专利摘要显示,本发明涉及一种语言模型工具调用方法、装置、计算机设备和存储介质。所述方法包括:构建语言模型微调的训练数据;训练数据包括提示语句、本地函数库、问题集和答案集;问题集作为训练数据中用户角色的输入,答案集中标注的函数名称和参数、提示语句以及本地函数库的子集作为训练数据中助手角色的输入,答案集中标注的函数调用返回作为训练数据中工具角色的输入;使用训练数据对语言模型进行微调训练;其中,微调训练时,语言模型在反向传播中不计算用户角色和工具角色的损失值;采用完成微调训练的语言模型根据用户输入的问题进行推理,得到需要调用的目标函数工具。采用本方法可以提升大语言模型工具调用的识别准确率和泛化性。