国产大模型企业DeepSeek“点燃”资本市场。
新模型会自我认知为DeepSeek-V3。
不仅如此,Torch-MUSA v2.0.0在完整支持PyTorch 2.2.0的基础上,还新增了对PyTorch2.5.0的支持,使开发者能够在基于MUSA Compute Capability 3.1…
升级的MUTLASS高性能线性代数模板库,支持MUSA Compute Capability 3.1的全新特性,并提供了若干算子的优化参考实现,包括基于FlashAttention3思想实现的FlashML…
2月26日消息,DeepSeek公布开源周第三天的开源项目——DeepGEMM。据介绍,DeepGEMM是一个支持密集型和混合专家(MoE)通用矩阵乘法(GEMM)运算的 FP8 通用矩阵乘法库,它…
MI325X也支持八块并行组成一个平台,这就有多达2TB HBM3E、48TB/s带宽,总的性能高达FP16 10.4PFlops(每秒1.04亿亿次)、FP8 20.8 PFlops(每秒2.08亿亿次…
08/20 10:25
08/20 10:24
08/20 10:23
08/20 10:22