当前位置：首页 » 资讯 » 新科技 » 正文

华为公布AI模型运行新专利：优化数据预取降低延时

IP属地中国·北京 编辑：顾雨柔手机中国 时间：2025-09-05 20:11:54

9月5日，天眼查App信息显示，华为技术有限公司申请的“AI模型的运行方法、装置、程序产品和存储介质”专利已正式公布。该专利于当日公开，旨在优化人工智能模型在异构计算环境下的运行效率，减少因数据搬运导致的处理延迟。
根据专利摘要，该技术属于机器学习领域，主要应用于包含处理器与计算卡协同工作的主机系统。在AI模型训练或推理过程中，输入数据通常分批处理。当系统处理第二组数据时，若其包含前一批数据中未出现的新数据，传统架构需临时从主机内存调取相关嵌入向量（Embedding Vector），易造成计算卡等待，影响整体效率。
华为此次公布的方案提出了一种前瞻性的数据预取机制。具体而言，主机的处理器会先分析相邻两组输入数据的差异，识别出在第二数据组中出现但未存在于第一数据组中的“第一数据”。随后，系统提前将这部分新增数据对应的嵌入向量预取至处理器本地的第一内存，并生成相应的向量信息。
关键在于，在计算卡处理第二组数据的同时，系统可根据预生成的向量信息，将所需嵌入向量从主机端的第一内存快速预取至计算卡自带的第二内存中。这一操作实现了数据搬运与计算过程的并行化，有效避免了计算资源的空闲等待，从而显著降低整体处理延时。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

OpenAI发布GPT-5.4 mini与nano，以更低成本逼近旗舰模型性能

3400万年前，全球忽然跌入“冰室”，海洋生命却并未“一刀切”灭绝？

阿里的“DeepMind时刻”：吴泳铭亲征，Token帝国的黎明

杨植麟带队发论文，Kimi下一代模型架构曝光，推理之父惊呼：深度学习2.0要来了！

黄仁勋GTC完整演讲：生成Token的成本与效率，决定科技企业的营收与生死

阿里成立ATH：是破局之钥，还是大中台2.0？

全站最新

OpenAI发布GPT-5.4 mini与nano，以更低成本逼近旗舰模型性能

3400万年前，全球忽然跌入“冰室”，海洋生命却并未“一刀切”灭绝？

阿里的“DeepMind时刻”：吴泳铭亲征，Token帝国的黎明

杨植麟带队发论文，Kimi下一代模型架构曝光，推理之父惊呼：深度学习2.0要来了！

热门推荐

OpenAI发布GPT-5.4 mini与nano，以更低成本逼近旗舰模型性能

亚马逊CEO：AI或推动AWS销售2036年达6000亿美元，较此前预期翻倍

微软重组AI部门，整合Copilot产品线

Meta再收缩元宇宙战略，Quest头显将无法访问Horizon Worlds

3400万年前，全球忽然跌入“冰室”，海洋生命却并未“一刀切”灭绝？

阿里的“DeepMind时刻”：吴泳铭亲征，Token帝国的黎明

杨植麟带队发论文，Kimi下一代模型架构曝光，推理之父惊呼：深度学习2.0要来了！

黄仁勋GTC完整演讲：生成Token的成本与效率，决定科技企业的营收与生死

阿里成立ATH：是破局之钥，还是大中台2.0？

阿里“下大棋”：成立TokenHub事业群，推企业级AI原生工作平台“悟空”

阿里发布全球首个企业级AI原生平台“悟空”，打造全天工作的“AI Agent军团”

在闲鱼，他帮人抓住一只狂奔的“龙虾”

360正式发布“安全龙虾”系列产品周鸿祎现场为用户“一键装虾”

阿里想当AI“卖铲人”：吴泳铭挂帅ATH事业群，悟空事业部首次亮相

全网炸锅！大模型惨遭“投毒”，有多可怕？

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

华为公布AI模型运行新专利：优化数据预取降低延时

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

华为公布AI模型运行新专利：优化数据预取 降低延时

同类资讯

华为公布AI模型运行新专利：优化数据预取降低延时