当前位置: 首页 » 资讯 » 新科技 » 正文

阶跃星辰开源Step 3.5 Flash,推理速度可达每秒350个token

IP属地 中国·北京 编辑:吴婷 凤凰网科技 时间:2026-02-02 23:49:37

2月2日,人工智能公司阶跃星辰正式发布并开源其最新的基座大模型Step 3.5 Flash。该模型旨在为开发者构建智能体(Agent)提供底层支持,并针对规模化应用下的稳定性与响应速度进行了优化。

据官方介绍,Step 3.5 Flash采用了稀疏混合专家(MoE)架构,总参数量达到1960亿。通过技术设计,每个Token实际激活的参数约为110亿,以实现推理能力与运行效率的平衡。在官方公布的测试中,该模型在LiveCodeBench V6代码挑战、AIME 2025数学竞赛等多项评测中展现了竞争力,单请求代码任务下最高推理速度可达每秒350个token。

在应用层面,该模型被设计用于处理需要多步推理、复杂逻辑求解及长时间运行的任务。官方表示,模型支持在NVIDIA DGX Spark、Apple M3/M4 Max以及AMD AI Max+ 395等主流个人工作站上进行本地部署,以满足数据隐私和本地算力应用的需求。

目前,Step 3.5 Flash已在OpenRouter、GitHub及阶跃星辰官方应用平台上线,面向开发者提供。与此同时,阶跃星辰宣布其下一代模型Step 4的训练工作已经启动。

标签: 星辰 阶跃 架构 稳定性 开源 官方 工作站 数据 部署 开发者 模型 平台 任务 上线 科技 实际 能力 凤凰网 参数 效率 数量 总参 代码 规模化 响应速度 面向 算力 个人 公司 人工智能

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。