2月2日,阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash。该模型面向实时Agent工作流场景,采用稀疏MoE架构,总参数量为1960亿,每个token激活约110亿参数,旨在兼顾推理速度与使用成本。
据官方介绍,在单请求代码类任务中,Step 3.5 Flash的推理速度最高可达每秒350个token。目前,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商已完成对该模型的适配。
阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起“模芯生态创新联盟”,旨在通过联合优化提升算力效率,推动大模型在应用场景中的落地。此次模型发布被视为其在模型与算力协同方向的进一步实践。





京公网安备 11011402013531号