天眼查App显示,近日,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利公布。
摘要显示,该发明涉及人工智能领域,有益效果在于将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,均衡负载任务,实现最大化的硬件利用,减少闲置算力,降低整体延迟,提高吞吐量,增强系统的扩展性和容错性。
天眼查App显示,近日,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利公布。
摘要显示,该发明涉及人工智能领域,有益效果在于将预填充阶段和解码阶段分别部署在高性能计算能力和大内存的机器上,均衡负载任务,实现最大化的硬件利用,减少闲置算力,降低整体延迟,提高吞吐量,增强系统的扩展性和容错性。
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
热门推荐