当前位置：首页 » 资讯 » 新科技 » 正文

Jan团队发布Jan-v2-VL-Max！30B多模态模型专攻长周期Agent任务，长序列执行稳超Gemini 2.5 Pro

IP属地中国·北京 编辑：江紫萱 Chinaz 时间：2025-12-24 16:23:18

在AI智能体（Agent）向复杂、多步任务演进的关键阶段，开源社区迎来一员新锐猛将。Jan团队今日正式发布 Jan-v2-VL-Max——一款300亿参数的多模态大模型，专为长周期、高稳定性自动化执行场景打造，在关键指标上已超越谷歌Gemini2.5Pro与DeepSeek R1，为开源Agent生态注入强劲动力。
聚焦“误差累积”难题，专治多步执行“失焦”
当前多模态Agent在执行长序列操作（如自动化UI操作、跨应用任务流）时，常因中间步骤微小偏差导致后续任务全面偏离，即“误差累积”问题。Jan-v2-VL-Max针对性引入 LoRA-based RLVR(Reinforced Long-horizon Vision-Language Reasoning)技术，在保持Qwen3-VL-30B基座能力的同时，显著提升推理链的一致性与抗干扰能力，确保任务在数十步操作后仍精准执行。
“幻象递减回报”测试登顶，定义Agent新基准
该模型在全新评测基准 “幻象递减回报”（Hallucination-Decay Return， HDR）中表现突出。该基准专门衡量Agent在任务长度延伸过程中，因幻觉或逻辑断裂导致回报率下降的速度。Jan-v2-VL-Max在长序列任务中维持高回报稳定性，超越Gemini2.5Pro与DeepSeek R1，验证其在真实自动化场景中的可靠性。
即开即用，支持本地高效部署
为降低使用门槛，Jan团队提供:
- 网页端直接交互界面，用户可上传图像、输入指令，测试多步自动化流程;
- vLLM优化本地部署方案，支持在消费级GPU上高效运行，便于开发者集成至自研Agent系统。
开源社区的“长思考”突破
Jan-v2-VL-Max虽在长序列执行上相较基座模型仅实现“小幅提升”，但在Agent领域，每1%的稳定性提升都意味着可用性质变。这一成果标志着开源社区正从“单步响应”迈向“长程规划”，为UI自动化、机器人控制、多工具协同等高价值场景提供可落地的开源基座。
AIbase认为，当大模型竞争从“谁更聪明”转向“谁更可靠”，Jan团队此次聚焦执行稳定性的技术路径，恰逢其时。在Agent即将成为AI主交互范式的浪潮下，Jan-v2-VL-Max或将成为开发者构建“永不掉链子”智能体的关键拼图。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

当Anthropic的安全人设崩塌：一场被泄露戳穿的生存游戏

周鸿祎对话刘慈欣：人类不发展AI将导致文明停滞，“百亿智能体”将成新物种

中国巴菲特集体看好，互联网巨头机会来了？！

救命！AI 圈大逃离，马斯克慌了，普通人破局密码藏在这

AI应用范式向智能体跃迁，腾讯汤道生：即将发布混元3.0

国家互联网信息办公室开展2025年国家信息化发展情况网络问卷调查

全站最新

当Anthropic的安全人设崩塌：一场被泄露戳穿的生存游戏

周鸿祎对话刘慈欣：人类不发展AI将导致文明停滞，“百亿智能体”将成新物种

中国巴菲特集体看好，互联网巨头机会来了？！

救命！AI 圈大逃离，马斯克慌了，普通人破局密码藏在这

热门推荐

当Anthropic的安全人设崩塌：一场被泄露戳穿的生存游戏

周鸿祎对话刘慈欣：人类不发展AI将导致文明停滞，“百亿智能体”将成新物种

中国巴菲特集体看好，互联网巨头机会来了？！

救命！AI 圈大逃离，马斯克慌了，普通人破局密码藏在这

AI应用范式向智能体跃迁，腾讯汤道生：即将发布混元3.0

国家互联网信息办公室开展2025年国家信息化发展情况网络问卷调查

早期长投、场景协同——解码美团硬科技投资版图

如何选择北京本凡科技进行高效的小程序开发？

周鸿祎、刘慈欣共论AI 预判“百亿智能体”成全新物种

无人留存：马斯克旗下xAI最后一位联合创始人离职

首款骁龙8 Gen5小平板来了！OPPO Pad mini真机现身

苹果联合创始人沃兹尼亚克自曝几乎不用AI：很完美，但干巴巴的

钱学森星际航行码头设想正照进现实

三个“懂”，让4.5万开发者非来不可

X7还不是终点？宝马高管称对全尺寸SUV持开放态度