国内人工智能领域的知名科技公司稀宇科技 MiniMax,于今日正式宣布开源其原生多模态旗舰模型 MiniMax M3。此前官方已提前向业界开放了该模型的权重,并同步发布了极具技术含量的稀疏注意力机制论文,引发了开源社区的广泛关注。
综合性能荣登开源榜首作为 MiniMax 倾力打造的旗舰级模型,M3 拥有高达 428B 的总参数量,其中激活参数为 23B。值得一提的是,该模型是行业内首个从底层训练初期,就直接进行多模态混合训练的开源大模型。
凭借着卓越的技术架构,M3 在发布后的短短两周内,便在权威的全球综合智能指数排行榜上斩获了开源模型的第一名。针对发布初期访问量暴增导致的体验延迟,官方已经将模型的输出速度从最初的 30 TPS 优化提升至 80 TPS,未来还将继续提速。
顶尖编码与代码交付能力在多项高难度的编码与智能体能力评测中,MiniMax M3 均展现出了行业顶尖的技术水准。它不仅具备自主拆解复杂任务的能力,还能熟练调用各类外部工具进行多步推理。
与传统模型相比,M3 的代码编写能力实现了质的飞跃。官方表示其输出的代码旨在直接达到可交付的标准,而非“勉强能跑但仍需人工大量修改”的半成品,这将极大地解放开发者的生产力。





京公网安备 11011402013531号