当前位置：首页 » 资讯 » 新科技 » 正文

摩尔线程发布Torch-MUSA v2.7.0，增强AI模型训练与推理支持

IP属地中国·北京 编辑：王婷 IT之家 时间：2025-11-28 14:07:59

IT之家 11 月 28 日消息，近日，摩尔线程正式发布 PyTorch 深度学习框架的 MUSA 扩展库 ——Torch-MUSA v2.7.0，新版本在功能集成、性能优化与硬件支持方面实现进一步突破。Torch-MUSA 在短短一个月内，连续完成 v2.5.0 和 v2.7.0 两次版本更新。
据介绍，自 v2.5.0 起，Torch-MUSA 版本号已与 PyTorch 主版本号保持同步，便于开发者进行版本识别与管理。新版本进一步集成 muSolver 与 muFFT 等计算加速库，显著提升复杂计算任务的执行效率；同时新增对统一内存设备（Unified Memory）的 UMM 支持，有效优化内存使用效率。
此外，新版本继续保持与最新 MUSA SDK 的兼容性，支持使用 MUSA SDK 4.2.0 至 4.3.0 及更高版本进行编译。目前 Torch-MUSA 专属支持的算子总数已超过 1050 个，系统在性能与稳定性方面均实现进一步提升。
v2.7.0 版本主要更新内容：
新增特性
新增 muFFT 与 muSolver 库集成，大幅扩展计算能力；
在面向边缘计算的 SoC 设备中支持统一内存管理，基于 Arm 架构的 UMA（统一内存寻址）设计，实现 GPU 与 CPU 共享同一物理内存空间，显著降低模型运行过程中的内存开销，具体包括：消除 GPU 端重复内存分配；减少主机与设备间的内存拷贝；GPU 可直接访问由 CPU 分配器申请的内存空间。
算子扩展与性能优化
新增支持包括 ilshift、irshift、replication_pad1d_bwd、angle、ctcLossTensor、ctcLossTensorBwd、logit、amin / amax / prod.dim_int、glu_bwd 等多个算子；
新增基础 Sparse (CSR) 操作支持；
扩充量化算子支持范围；
修复 torch.norm 形状错误问题；
支持 reduce_sum 的 uint8 输入与 int64 输出；
C++ 扩展新增支持 tensor.is_musa 方法；
修复空输入下 argmax/argmin 的异常行为；
优化 var / std、pad、convolution3d、layer_norm 等操作的执行效率。
系统功能增强
开放 torch.musa.mccl.version 接口；
支持 getCurrentMUSABlasHandle 与 getCurrentMUSABlasLtHandle；
优化 FSDP2 流水线并行策略，降低训练内存占用。
IT之家从官方获悉，Torch-MUSA 将继续跟进 PyTorch 的版本更新，计划下一版本支持 PyTorch 2.9.0，并进一步优化性能与功能。
Torch-MUSA 开源地址：https://github.com/MooreThreads/torch_musa

标签：版本算子性能 内存空间 内存功能摩尔效率系统线程策略面向问题深度开源边缘错误框架地址 计算能力 形状内容方面 稳定性 模型过程总数专属计划硬件 流水线 特

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

现场组队“养虾”！V聚场这场派对让开发者直呼“真香”

科创燃梦，2026青少年科创即时挑战体验日活力开启

Rokid乐奇眼镜正经历“蓝海到红海”？

钛3闪充版上市，比亚迪闪充技术规模化落地

AI穿戴设备杀疯了！戒指测心率、眼镜当翻译，谁在争抢用户手腕手指？

吉利银河：未来全系混动车型将搭载神盾金砖电池

全站最新

现场组队“养虾”！V聚场这场派对让开发者直呼“真香”

科创燃梦，2026青少年科创即时挑战体验日活力开启

Rokid乐奇眼镜正经历“蓝海到红海”？

钛3闪充版上市，比亚迪闪充技术规模化落地

热门推荐

法官：马斯克向OpenAI索赔1340亿美元是凭空捏造

现场组队“养虾”！V聚场这场派对让开发者直呼“真香”

科创燃梦，2026青少年科创即时挑战体验日活力开启

Rokid乐奇眼镜正经历“蓝海到红海”？

钛3闪充版上市，比亚迪闪充技术规模化落地

AI穿戴设备杀疯了！戒指测心率、眼镜当翻译，谁在争抢用户手腕手指？

吉利银河：未来全系混动车型将搭载神盾金砖电池

聚焦不同圈层用户出行需求，东风奕派三车焕新亮相

联想3月16日起推出OpenClaw免费部署服务

比亚迪全新元PLUS工信部“证件照”公布，车身加长至4.6米

折痕没了！OPPO Find N6登陆线下门店网友：这才叫无印良品

科幻变"处方" 全球首款植入式脑机接口获批上市

机圈V单来了！vivo X300 Ultra月底见：首发400mm增距镜望远无敌

美媒傻眼：十年前哪能想到，中国有这两张王牌…

男子花25800买大皮卡到货竟是老头乐宣传续航300公里实为32公里：网友唏嘘