当前位置：首页 » 资讯 » 新科技 » 正文

阿里通义千问发布小尺寸模型Qwen3-4B，性能超越GPT4.1-Nano

IP属地中国·北京 编辑：杨凌霄 TechWeb 时间：2025-08-07 18:32:14

阿里通义千问今日宣布，其新发布的Qwen3-4B模型系列中的两个新模型——Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507——已经在魔搭社区和HuggingFace平台上正式开源。
新模型在非推理领域表现出色，Qwen3-4B-Instruct-2507全面超越了闭源的小尺寸模型GPT4.1-Nano，并在性能上接近中等规模的Qwen3-30B-A3B（non-thinking）。在推理领域，Qwen3-4B-Thinking-2507的表现甚至可以与Qwen3-30B-A3B（thinking）相媲美。
官方指出，2507版本的Qwen3-4B模型特别适合在手机等端侧硬件上部署，这将使得手机等移动设备能够高效地运行这些模型。
Qwen3-4B-Instruct-2507模型的通用能力得到了大幅提升，不仅超越了商业闭源的小尺寸模型GPT-4.1-nano，而且在性能上接近Qwen3-30B-A3B（non-thinking）。新模型还覆盖了更多语言的长尾知识，并在主观和开放性任务中增强了人类偏好对齐，能够提供更符合人们需求的答复。此外，模型的上下文理解能力扩展至256K，使得小模型也能够处理长文本。
Qwen3-4B-Thinking-2507模型在推理能力上得到了大幅增强，AIME25得分高达81.3分，推理表现可以媲美Qwen3-30B-Thinking模型。特别是在AIME25测评中，该模型在数学能力方面表现出色，以4B参数量获得了81.3分的高分。此外，该模型的Agent分数也非常突出，相关评测均超越了更大尺寸的Qwen3-30B-Thinking模型。模型的256K tokens上下文理解能力支持更复杂的文档分析、长篇内容生成、跨段落推理等场景，为用户提供更加丰富的应用体验。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

AI健康，开出更多“良方”

理想高管：理想Mega召回率超97.5% 满意度已升至理想全系最高

技嘉Brix迷你主机登场，可选酷睿Ultra 9 386H处理器

299元风冷新选择，银昕FM620 Pro来了

“1人+1万块GPU”能否成独角兽，OpenAI的预言正被上海验证

哈啰租电动车回应央视315报道：未直接经营线下门店，车辆均为入驻商家自行采购运营

全站最新

AI健康，开出更多“良方”

理想高管：理想Mega召回率超97.5% 满意度已升至理想全系最高

技嘉Brix迷你主机登场，可选酷睿Ultra 9 386H处理器

299元风冷新选择，银昕FM620 Pro来了

热门推荐

AI健康，开出更多“良方”

申琦：老年AI课，别变了味

理想高管：理想Mega召回率超97.5% 满意度已升至理想全系最高

“自然指数”最新榜单出炉：前十科研机构中国占九席，国家层面中国继续第一

技嘉Brix迷你主机登场，可选酷睿Ultra 9 386H处理器

299元风冷新选择，银昕FM620 Pro来了

“1人+1万块GPU”能否成独角兽，OpenAI的预言正被上海验证

哈啰租电动车回应央视315报道：未直接经营线下门店，车辆均为入驻商家自行采购运营

古尔曼：预计苹果只会率先为MacBook Pro换用触控屏

古尔曼：苹果iOS 27将为折叠屏机型iPhone Fold带来分屏能力

央视3・15晚会曝光汇总；曝字节暂停Seedance 2.0全球发布计划

紫牛头条｜我发现的新天体上户口啦！业余天文摄影师发现“小气泡” 成为“星云爸爸”

苹果iOS 27或似“雪豹”，专注修复与稳定！

福特CEO法利试驾中国皮卡：承认竞争力，但干重活能力有待加强

科技连线｜OpenClaw之后，AI智能体将走向何处