当前位置：首页 » 资讯 » 新科技 » 正文

百度申请大语言模型的训练方法等专利，提高大语言模型在复杂任务中的灵活性

IP属地中国·北京 编辑：王婷金融界 时间：2024-09-26 15:41:42

2024年9月26日消息，国家知识产权局信息显示，北京百度网讯科技有限公司申请一项名为“大语言模型的训练方法、装置和电子设备”的专利，公开号CN 118690874 A，申请日期为2024年6月。
专利摘要显示，本公开提出了一种大语言模型的训练方法、装置和电子设备，涉及人工智能技术领域，具体为大模型和深度学习等技术领域，包括：基于知识库中文本数据，获取预训练的第一大语言模型和预训练的知识激活网络KANs；基于所述KANs对所述第一大语言模型进行更新，得到第二大语言模型；基于文本偏好数据集，对所述第二大语言模型进行多任务训练，得到目标大语言模型，由此，本公开通过使用KANs替换大语言模型中的多层感知器网络，并通过文本偏好数据集，对大语言模型进行多任务训练，得到目标大语言模型，有效地解决了大语言模型训练过程中存在的遗忘性问题，提高了大语言模型在复杂任务中的灵活性和表达能力，提高了大语言模型的稳定性。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

今天愚人节 B站首页限时彩蛋重磅上线能看别人喜欢内容

2026 年小程序店铺哪家强？精选5家实力小程序店铺开发平台

谷歌发布开源模型Gemma 4

微软将在日本投资100亿美元，用于人工智能领域

OpenAI联合创始人揭秘为何 “杀掉” Sora：1220亿美元换不来无限算力

广东已有132款大模型“领证”，位居全国前列

全站最新

今天愚人节 B站首页限时彩蛋重磅上线能看别人喜欢内容

2026 年小程序店铺哪家强？精选5家实力小程序店铺开发平台

谷歌发布开源模型Gemma 4

微软将在日本投资100亿美元，用于人工智能领域

热门推荐

今天愚人节 B站首页限时彩蛋重磅上线能看别人喜欢内容

2026 年小程序店铺哪家强？精选5家实力小程序店铺开发平台

谷歌发布开源模型Gemma 4

微软将在日本投资100亿美元，用于人工智能领域

OpenAI联合创始人揭秘为何 “杀掉” Sora：1220亿美元换不来无限算力

广东已有132款大模型“领证”，位居全国前列

微软为Copilot研究智能体增加多模型AI功能，提升准确性

寒亭阿里巴巴详情页制作 2026 年潍坊泉顺的技术与实践路径

阿里腾讯深圳密会，字节豆包迎来最大变化？AI格局要变天

2026年产品经理如何提升自身知识与职业发展加速？核心能力提升路径与系统方法解析

1.4万亿词元！阿里Qwen3.6-Plus刷新OpenRouter日调用量纪录

米哈游创始团队向上海交大捐赠，助力AI专项基金

新款AirPods Pro 曝光！预计今年发布：三大升级提前看

小豆请你喝咖啡！张江AI小镇“居民”再迎重磅合作项目

Lenovo 800光能蓝牙键盘国行上市：满电纯黑续航30天，249元