当前位置：首页 » 资讯 » 新科技 » 正文

阿里开源下一代模型架构Qwen3-Next，模型训练及推理性价比创新高

IP属地中国·北京 编辑：朱天宇雷峰网 时间：2025-09-12 12:24:15

9月12日，阿里通义发布下一代基础模型架构Qwen3-Next。Qwen3-Next针对大模型在上下文长度和总参数两方面不断扩展（Scaling）的未来趋势而设计，采用全新的高稀疏MoE架构，并对经典Transformer核心组件进行了重构，创新线性注意力和自研的门控注意力结合的混合注意力机制，实现了模型训练和推理的双重性价比突破。
基于这一新架构，阿里通义“打样”了Qwen3-Next-80B-A3B系列模型，开源指令（Instruct）和推理（Thinking）两大模型版本。新模型总参数 80B 仅激活 3B，性能可媲美千问3旗舰版235B模型，模型计算效率大幅提升。Qwen3-Next训练成本较密集模型Qwen3-32B大降超90%，长文本推理吞吐量提升10倍以上，并可支持百万Tokens超长上下文。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

OpenAI发布GPT-5.2-Codex：号称工程实战能力天花板

第42次南极考察人员登陆后有何重点工作？

国产大模型叩响资本市场大门

iPhone最高立减2000多元，数百人排队抢购榴莲！海南今起封关，网友已经在看机票了……

1秒定位船舶，语音识别率近九成！吴淞海事局自研系统将推动安全监管向智能化迈进

上海算力综合指数连续多年居全国前列，在用数据中心达136个

全站最新

OpenAI发布GPT-5.2-Codex：号称工程实战能力天花板

第42次南极考察人员登陆后有何重点工作？

国产大模型叩响资本市场大门

iPhone最高立减2000多元，数百人排队抢购榴莲！海南今起封关，网友已经在看机票了……

热门推荐

OpenAI发布GPT-5.2-Codex：号称工程实战能力天花板

充满争议仍获放行：密歇根州批准为甲骨文与OpenAI超级数据中心供电

会玩！中国科学家“撸”的这只“猫”，入选2025全球物理学年度亮点

第42次南极考察人员登陆后有何重点工作？

国产大模型叩响资本市场大门

开放第三方支付苹果在日调整规则

80后亿万富翁出任NASA局长主张与中国太空竞争

iPhone最高立减2000多元，数百人排队抢购榴莲！海南今起封关，网友已经在看机票了……

社评：中国科技进步，路透社本不必焦虑

1秒定位船舶，语音识别率近九成！吴淞海事局自研系统将推动安全监管向智能化迈进

上海算力综合指数连续多年居全国前列，在用数据中心达136个

欧盟“撤回”2035全面电动化

iPhone内存用完就坏了？苹果客服回应

盛路通信：公司研发的微波模块组件可应用于卫星通信系统

首创ACE具身研发范式大晓机器人构建具身智能开放新生态