以开源生态打破国际垄断,推动国产算力发展。9月12日,上海创智学院发布下一代大模型开源AI基础设施——自主可控的强化学习框架siiRL 2.0与低比特训练技术 Metis。
上海创智学院
该学习框架被誉为“下一代模型的动力引擎”,原生支持华为昇腾、沐曦等多款国产芯片,实现千卡级强化学习训练,为国内首个突破,其完全分布式设计未来可扩展至万卡集群,多模态和长上下文场景效率较主流框架快2-7倍。针对当前全球TOP模型中80% 未开源,siiRL以开源生态推动多智能体协同与深度认知能力发展,助力AGI技术普惠。
团队还提出Metis框架,训练过程的计算精度,接近无损的从fp32压缩到fp4,首次揭示了大模型低精度训练的问题根因进而提出了接近无损的大模型预训练方法,为国产芯片指明并验证了低比特训练的路径,未来芯片可以针对低比特高吞吐计算优化架构,在降低功耗和成本的同时提升国际竞争力。
据悉,学院还将于近日启动“AI基础设施开源周”,发布全链路技术栈,包括下一代训练框架、推理引擎、万卡集群通信库与智能运维系统,持续推动国产算力生态建设。
记者获悉,创智自主智算项目已建设超万P智算集群,构建全球高校最大算力平台之一,创立“建中研、干中学”机制引导学生深入算力建设一线,以开源开放为激励导向,培养具备国际竞争力的AI基础设施人才。
原标题:《开源技术栈赋能国产算力生态 创智学院发布全球领先AI基础设施成果》
栏目编辑:王蔚
作者:新民晚报 易蓉