当前位置: 首页 » 资讯 » 新科技 » 正文

阿里Qwen3-Coder编程模型开源,480B参数领跑智能体编程赛道

IP属地 中国·北京 编辑:任飞扬 时间:2025-07-23 14:10:59

阿里巴巴Qwen团队近日宣布了一项重大进展,他们开源了最新的旗舰编程模型Qwen3-Coder-480B-A35B-Instruct。这一开源举措标志着Qwen团队在智能体编程领域迈出了重要一步,该模型以其强大的功能和广泛的适用性引起了业界的广泛关注。

Qwen3-Coder拥有4800亿个参数,其中350亿个参数处于激活状态。它能够原生支持256K的上下文长度,并可通过技术扩展至100万上下文(输入),最大输出能力达到6.5万个token。这一性能表现在基准测试中得到了验证,Qwen3-Coder在智能体编程、智能体浏览器使用和智能体工具调用等三类任务中均取得了开源领域的最优成绩,甚至超越了Kimi K2、DeepSeek V3等开源模型,以及闭源的GPT-4.1模型,其编程能力与Claude Sonnet 4模型不相上下。

Qwen3-Coder不仅参数规模庞大,而且在实际应用中展现出极高的效率。据阿里巴巴官方介绍,借助这一模型,初级程序员能够在一天内完成资深程序员一周的工作量。例如,生成一个品牌官网的速度最快可达5分钟。这一显著的工作效率提升,无疑将为软件开发行业带来巨大的变革。

除了强大的Qwen3-Coder模型外,Qwen团队还开源了一个智能体编程命令行工具——Qwen Code。这一工具是基于Gemini Code进行分叉和定制开发的,通过适配特定的提示和函数调用协议,能够更充分地发挥Qwen3-Coder在智能体编程任务上的潜力。这一工具的推出,将进一步降低智能体编程的门槛,使得更多的开发者能够轻松上手。

Qwen3-Coder模型已在阿里云旗下的大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入的token量调整价格。在特定的输入范围内,其价格与Claude Sonnet 4模型相比略高,但考虑到其更强大的功能和性能表现,这一价格定位仍然具有相当的竞争力。Qwen3-Coder的480B版本也已在Hugging Face、魔搭等开源社区发布,可供开发者下载和本地部署。

在Qwen3-Coder正式发布前,这一模型已经悄然在Qwen Chat官网上线,并吸引了一批海外网友进行实测。他们通过Qwen3-Coder开发出了各种有趣的应用,如Wordle单词游戏、找不同游戏等。这些案例充分展示了Qwen3-Coder在指令遵循、UI设计、动画等方面的强大能力。同时,国内媒体也尝试让Qwen3-Coder开发了一个中英文术语库,并对其生成结果进行了进一步的修改和优化。

在技术细节方面,Qwen团队在博客文章中分享了Qwen3-Coder的部分训练细节。他们指出,预训练阶段使用了7.5万亿token的数据,其中代码占比高达70%,这使得模型在编程方面表现出色,并保留了通用和数学能力。Qwen3-Coder还通过自动扩展多样化编程任务的测试用例,创建了高质量的训练实例,进一步释放了强化学习的潜力。这一做法不仅提高了代码执行成功率,还为其他任务带来了显著收益。

在后训练阶段,Qwen团队引入了长视距强化学习(智能体强化学习),鼓励模型通过使用工具进行多轮交互来解决现实世界任务。为了应对环境扩展的挑战,他们构建了一个能够并行运行20000个独立环境的可扩展系统。这一基础设施为大规模强化学习提供了必要的反馈和支持,使得Qwen3-Coder在SWE-Bench Verified中实现了开源模型中的最佳性能。

随着Qwen3-Coder的开源和广泛应用,阿里巴巴Qwen团队将继续努力提升Coding Agent的性能,旨在让它承担软件工程中复杂和乏味的任务,从而释放人类的生产力。未来,我们期待看到更多基于Qwen3-Coder的创新应用和开发成果。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。