当前位置：首页 » 资讯 » 新科技 » 正文

芯原微电子申请大语言模型数据管理专利，减少大语言模型推理所需缓存数据量

IP属地中国·北京 编辑：王婷金融界 时间：2024-09-30 18:42:19

2024年9月30日消息，国家知识产权局信息显示，芯原微电子（上海）股份有限公司申请一项名为“大语言模型数据管理方法、装置、电子设备及存储介质”的专利，公开号 CN 118709781 A，申请日期为2024年6月。
专利摘要显示，本申请旨在提供一种大语言模型数据管理方法、装置、电子设备及存储介质，涉及神经网络领域。大语言模型数据管理方法包括：在所述注意力层进行非首轮推理的情况下，将目标矩阵输出至所述注意力层，以使所述注意力层基于所述目标矩阵计算前一轮推理生成的键向量和值向量；其中：所述目标矩阵存储在所述存储单元内，所述目标矩阵包括初始向量和N个累加向量；在所述注意力层基于所述键向量和所述值向量完成当前轮次的推理后，基于所述累加向量对所述存储单元内的目标矩阵进行累加。通过上述方式，可以减少大语言模型不断推理过程中存储器所需缓存的数据量。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

MIT在分子内造出微型对撞机，首次窥探原子核内部磁力分布

“我为企业跑订单·统战溧行”直播电商专场对接活动成功举办

它来了，它和苏超一起来了！

事实不如微软所愿！Windows 10停止支持：反带动苹果Mac销量大增

AMD R5 7500X3D现身：入门级Zen4游戏处理器，预计 CES 2026 发布

维修专家怒批RTX 5090公版显卡设计：接口脆弱几乎无法修复

全站最新

MIT在分子内造出微型对撞机，首次窥探原子核内部磁力分布

“我为企业跑订单·统战溧行”直播电商专场对接活动成功举办

它来了，它和苏超一起来了！

事实不如微软所愿！Windows 10停止支持：反带动苹果Mac销量大增

热门推荐

MIT在分子内造出微型对撞机，首次窥探原子核内部磁力分布

“我为企业跑订单·统战溧行”直播电商专场对接活动成功举办

它来了，它和苏超一起来了！

事实不如微软所愿！Windows 10停止支持：反带动苹果Mac销量大增

苹果，突曝大消息！

AMD R5 7500X3D现身：入门级Zen4游戏处理器，预计 CES 2026 发布

维修专家怒批RTX 5090公版显卡设计：接口脆弱几乎无法修复

“吉林一号”卫星发布多张台湾岛高清卫星影像，台胞：这是中华民族的骄傲

保时捷利润暴跌99%

共享充电宝竟无3C认证？！

揭秘OpenAI 1.5万亿美元交易内幕：奥特曼核心圈子主导，绕开银行家和律师

苹果藏了一手！M5 MacBook Pro隐形升级：SSD速度提升211%

适老支付的“默认隐忧”

富士康印度工厂正准备将 AirPods 的月产量翻一番

iPhone 18 的运行内存容量可能比上一代增加 50%