新榜讯 2月25日,阿里云百炼正式推出Coding Plan,该服务包含Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大开源模型API服务。用户在订阅相关套餐后,将不再局限于使用单…
一位开发者分享了其部署Qwen3.5-35B-A3B的情况,称模型可以跑在16GB的显存机器上,处理32k上下文时,每秒处理数能达到60-70个任务;但他也提到,模型吞token的速度惊人,一个短谜题就用了…
阿里Qwen3.5开源家族扩容,多尺寸AI模型上新
此次发布毫无征兆,无发布会、无媒体宣传,仅官方低调官宣,却迅速刷屏科技圈,其背后是阿里在大模型领域的长期布局,暗藏改写行业格局的力量。除夕夜阿里发布的千问Qwen3.5,是中国AI产业发展的缩影。 从国内…
与前代产品不同,Qwen3.5实现了从纯文本模型到原生多模态模型的代际跃迁。 性能方面,Qwen3.5在MMLU-Pro知识推理评测中得分87.8分,超越GPT-5.2;在博士级难题GPQA测评中斩获88.…
阿里除夕夜甩出王炸!千问Qwen3.5重磅发布 登顶全球最强开源模型
这种对思维深度的精细化控制,是Qwen3.5-Plus能够以17B激活参数抗衡万亿模型的核心技术屏障,让其在保持强大性能的同时,显著降低了计算资源需求,为大模型的普惠化应用奠定了基础,这也是其与Qwen3-…
千问团队自研的门控技术成果,曾斩获全球AI顶会2025 NeurIPS最佳论文,该前沿技术已融入千问3.5创新的混合架构中去,团队结合线性注意力机制与稀疏混合专家MoE模型架构,实现了397B总参数激活仅17…
它采用了全新的混合注意力机制(Hybrid Attention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。行业分析人士认为,阿里选择在除夕夜这一关键…
01/20 14:04
01/20 13:53