当前位置: 首页 » 资讯 » 新科技 » 正文

1美元跑200个浏览器任务!开源浏览器操控神器BU-30B-A3B-Preview横空出世

IP属地 中国·北京 编辑:陆辰风 Chinaz 时间:2025-12-26 12:28:41

近日,知名开源浏览器自动化项目BrowserUse正式发布了其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便引发广泛关注,被誉为“网页代理(Web Agent)领域的全新标杆”,以极致的成本效益和实时速度,彻底颠覆了AI浏览器操作的门槛。

模型架构:MoE设计,实现“大脑强大、身材轻盈”

BU-30B-A3B-Preview采用混合专家(MoE)架构,总参数规模达30B(300亿),但实际推理时仅激活3B(30亿)参数。这使得模型在保持顶级智能水平的同时,资源消耗大幅降低,仅需单张消费级GPU即可流畅运行。

该模型基于阿里云通义千问Qwen3-VL-30B-A3B-Instruct进行深度微调,专为浏览器自动化场景优化,支持多模态输入(视觉+文本),上下文长度高达32K tokens,能够轻松处理复杂长网页内容。

核心能力:卓越的DOM理解与视觉推理

BU-30B-A3B-Preview在浏览器操作任务中表现出色,具备全面的网页交互功能,包括精准元素定位、点击、滚动、表单填写等。其突出的DOM(文档对象模型)理解能力和视觉推理能力,让AI代理能像人类一样“看懂”页面布局和截图,实现高度可靠的自动化执行。

官方强调,该模型特别适合构建Web Agent应用场景,如自动化测试、数据采集、RPA流程等,已在内部基准测试中达到业内领先水平。

性能亮点:速度与成本双重碾压

官方发布的对比数据显示,BU-30B-A3B-Preview在任务完成速度和经济性上远超主流商用模型:

- 平均每步操作仅需1.2秒,整体任务完成时间大幅领先。

- 成本效益惊人:每1美元计算资源可可靠完成约200个浏览器任务,是部分竞品模型的数十倍。

由于模型体积相对较小(单GPU部署友好),开发者可轻松本地下载测试,无需高额云端费用。

开源意义:加速Web Agent生态发展

BU-30B-A3B-Preview已完全开源,模型权重上传至Hugging Face平台,任何开发者均可免费获取并集成到BrowserUse开源库中。这标志着浏览器自动化领域进入“高效开源时代”,有望推动更多创新应用落地。

AIbase点评 BU-30B-A3B-Preview的出现,完美解决了传统大模型在浏览器任务中“贵而慢”的痛点。对于需要大规模网页自动化的企业和开发者而言,这无疑是一款性价比极高的选择。未来,随着社区进一步优化,该模型有望成为Web Agent领域的标准配置。感兴趣的读者可立即前往Hugging Face下载体验。

地址:https://huggingface.co/browser-use/bu-30b-a3b-preview

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新