深圳商报·读创客户端记者 苑伟斌
1月12日,科大讯飞董事长刘庆峰在第九届全球深商盛典暨中国企业家俱乐部20年活动上表示,在全国产算力平台上,国产大模型在模型参数小一倍情况下已经实现综合性能对标国际主流大模型。在芯片受限的背景下,自主可控的AI基础设施已初步成型。
刘庆峰说,科大讯飞过去几年在受限的有限算力资源条件下,关于星火大模型训练和推理成本效率的持续优化做了大量投入,和直接使用英伟达卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力路线。
据了解,从2023年5月起,科大讯飞就联合华为先后攻克了万卡高速互联组网、计算通信隐藏、训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,将通用大模型、类o1的深度推理模型等的训练效率对标A100均从最初的30%-50%优化达到了85%-95%以上;
2025年以来,科大讯飞再次攻克国产算力训练的两座大山,一是攻克长思维链强化学习训练效率,深度推理训练效率从对标A800的30%提升至84%以上,二是攻克MoE模型全链路训练效率,MoE模型的训练效率从今年3月对标A800的30%提高到93%,实现国产算力平台上在该领域从0到1的重大突破。
“可以自豪地告诉大家,今天中国所有的主流大模型中,讯飞星火是唯一基于全国产算力训练的通用大模型。”刘庆峰说,随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。
刘庆峰表示,机器时代,人工智能绝不是来替代人类,我们追求的目标是,让每个人都能站在人工智能的肩膀上,成为更好的自己。
据悉,1月12日,科大讯飞开盘后大涨,收盘涨7.19%。





京公网安备 11011402013531号