当前位置: 首页 » 资讯 » 新科技 » 正文

阿里云开源智能体WebSailor登顶BrowseComp评测榜单

IP属地 中国·北京 编辑:杨凌霄 三言科技Pro 时间:2025-07-08 12:12:12

今日阿里云宣布,通义实验室正式开源网络智能体WebSailor,该智能体凭借强大的推理与检索能力,在OpenAI发布的高难度智能体评测集BrowseComp上位列开源榜单首位。目前,其构建方案及部分数据集已在GitHub开源。

WebSailor专为复杂场景设计,能高效处理模糊问题,通过多步推理和交叉验证从海量信息中精准检索答案。通义实验室采用创新的post-training方法,显著提升了模型在网页推理任务中的表现。在BrowseComp评测中,WebSailor-32B和WebSailor-72B版本不仅领先于DeepSeek R1、Grok-3等开源模型,甚至超越部分闭源系统,仅次于OpenAI DeepResearch。

此外,WebSailor在普通任务数据集SimpleQA上也展现出优异性能,验证了其泛化能力。阿里云表示,该智能体的通用工作流及“高难度任务合成+高效RL优化”策略,可为开源社区解决复杂推理、学术发现等挑战提供借鉴。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。