人民财讯9月12日电,9月12日,阿里发布了下一代基础模型架构Qwen3-Next,并开源了基于该架构的Qwen3-Next-80B-A3B系列模型。相比于Qwen3的MoE结构,Qwen3-Next架构进行了一系列核心改进,具有更高效的特点。Qwen3-Next-80B-A3B-base模型拥有800亿参数,激活参数仅30亿,实现了与Qwen3-32B dense模型相近甚至略好的性能,而训练成本仅为十分之一不到,实现了极致的训练和推理性价比。
阿里推出更高效的Qwen3-Next人工智能模型
IP属地 中国·北京 编辑:陆辰风 证券时报 时间:2025-09-12 08:13:42
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
全站最新
热门推荐
- 2025外滩大会聚焦AI产业实践:大模型会否“吞掉”软件?韩歆毅朱啸虎等热议
- 《2025抖音生服白皮书》:特色人群价值凸显,PACE方法论助力商家营销新增长
- 阿里大涨8%!被曝正使用自主研发芯片训练大模型
- 阿里云创始人王坚:AI时代资源开放成关键,“计算卫星”或开启深空探索新篇
- 腾讯辟谣“前 OpenAl 姚顺雨上亿薪资入职腾讯”
- 2025,毕业生 “卷” 向出海
- 超10亿美元打水漂,“科技狂人”马斯克为什么被AI绊倒?
- 卖汉堡、卖狗粮,巴比食品不满足于包子了!
- 荣耀需要新竞争力
- 2025,毕业生 “卷” 向出海
- 卡夫亨氏拆分!巴菲特,怒了
- 苏宁易购12块钱卖掉12家超市
- 《流浪地球3》剧本完稿:分上下集
- 美团AI助手初体验:它或许能让你“戒掉”所有App
- 24家券商资管子公司半年考:8家营收下滑,国盛资管、广发资管陷亏损