当前位置: 首页 » 资讯 » 新科技 » 正文

阿里除夕夜将开源Qwen3.5模型 采用原生多模态架构

IP属地 中国·北京 编辑:朱天宇 CNMO科技 时间:2026-02-16 18:13:53

随着农历除夕的到来,阿里巴巴旗下的通义千问团队即将发布新一代开源大模型Qwen 3.5。目前该模型系列的相关代码已提交至Hugging Face与GitHub仓库,标志着这一备受期待的AI技术即将正式面向全球开发者开放。

Qwen 3.5 在架构设计上实现了显著进化。它采用了全新的混合注意力机制(Hybrid Attention),将线性注意力与标准注意力相结合,从而在保持强大推理能力的同时,大幅提升了长文本和复杂任务的处理效率。

与前代模型相比,Qwen 3.5是一款原生多模态模型。它能够直接理解并处理文本、图像、音频以及视频数据,无需依赖外部插件或子模型进行转换。初步透露的模型规格包括9B(90亿参数)指令微调版以及35B-A3B(基于MoE架构)的中型版本,后者在数学推理与编程能力上表现尤为出色。

当前的中国 AI 市场竞争已进入白热化阶段。除阿里外,DeepSeek 计划推出其 V4 模型,字节跳动也在升级其豆包系列。行业分析人士认为,阿里选择在除夕夜这一关键节点开源 Qwen 3.5,旨在通过技术领先地位获取春节期间的流量峰值,并巩固其在全球开源社区的影响力。

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。