2月25日,DeepSeek官宣,今日开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVlink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。

2月25日,DeepSeek官宣,今日开源DeepEP,第一个用于MoE模型训练和推理的开源EP通信库。特点有:高效、优化的全员沟通;节点内和节点间均支持NVlink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
热门推荐