当前位置: 首页 » 资讯 » 新科技 » 正文

10B 级“小核弹”:阶跃星辰开源 Step3-VL-10B,性能跨级挑战200B 大模型

IP属地 中国·北京 编辑:苏婉清 Chinaz 时间:2026-01-20 18:49:25

阶跃星辰近日宣布开源其最新多模态视觉语言模型Step3-VL-10B。该模型仅凭10B 的参数规模,在多项基准测试中展现出了跨级别的竞技状态,成功解决了小参数量模型难以兼顾高智能水平的行业痛点。

在核心性能测试中,Step3-VL-10B不仅在视觉感知、逻辑推理和数学竞赛等维度达到了同规模 SOTA 水平,更实现了对规模大其10到20倍的开源模型(如 Qwen3-VL-Thinking235B 等)以及顶级闭源旗舰模型的媲美甚至超越。依托全参数端到端多模态联合预训练和大规模强化学习迭代,该模型在 AIME 等高难度数学竞赛测试中已步入世界第一梯队。

此次开源涵盖了 base 和 Thinking 两个版本。得益于创新的并行协调推理机制(PaCoRe),模型在处理高精度 OCR、复杂计数及空间拓扑理解等任务时表现尤为稳健。这意味着原本依赖云端运行的复杂多模态推理能力,现在可以更低成本地部署在手机、电脑等端侧设备上,大幅提升了端侧 Agent 的交互效率。

项目主页:https://stepfun-ai.github.io/Step3-VL-10B/

论文链接:https://arxiv.org/abs/2601.09668

HuggingFace:https://huggingface.co/collections/stepfun-ai/step3-vl-10b

ModelScope:https://modelscope.cn/collections/stepfun-ai/Step3-VL-10B

划重点:

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。