在同等的参数量级下,新架构使其训练和推理效率提升了2.5倍。
06/10 22:33
06/10 22:02
06/10 21:30
06/10 19:33
06/10 17:02
06/10 17:01
06/09 17:34
06/09 17:33