当前位置：首页 » 资讯 » 新科技 » 正文

215 项 SOTA 狂揽！阿里发布 Qwen3.5-Omni：全模态性能跨越式超越 Gemini

IP属地中国·北京 编辑：柳晴雪 Chinaz 时间：2026-03-31 10:10:52

中国大模型正在全模态交互领域实现从“追随”到“领跑”的华丽转身。
3月30日，阿里正式发布千问新一代全模态大模型 Qwen3.5-Omni。该模型凭借混合注意力 MoE 架构，实现了图片、视频、语音及文字的无缝全模态输入与输出，标志着国产大模型在视听交互领域达到了全球顶尖水平。
全能战力:215项任务夺冠，硬核超越 Gemini
在衡量大模型综合实力的硬指标上，Qwen3.5-Omni 展现了统治级的表现:
SOTA 霸榜: 在音视频理解、识别与交互等共计215项测试任务中，该模型均取得 SOTA（性能最佳）表现。
对标优胜: 在 DailyOmni、QualcommInteractive 等聚焦视听交互的测试中，其得分大幅领先 Google 的 Gemini-3.1Pro。
抗干扰神技: 在嘈杂环境下的 WenetSpeech 测试中，其识别准确率极高，错误率远低于对手。
交互革命:113种语言识别与“动动嘴”编程
Qwen3.5-Omni 不仅更聪明，而且更懂“方言”和“代码”:
语言专家: 支持113种语言及方言的识别，甚至是毛利语、海南方言等小众语言也能精准捕捉。
Vibe Coding 进化: 开启了音视频编程新时代。用户只需打开摄像头，对着草图口述需求，模型即可直接生成带有复杂 UI 的产品原型界面，真正实现“所说即所得”。
生产力爆发:10小时音频长程理解
针对专业领域，新模型提供了极强的结构化处理能力:
视频深度拆解: 能对画面主体、人物关系及情绪起伏进行极细颗粒度的拆解。
自动切片: 支持超过10小时的音频输入，并能自动完成视频章节切片与时间戳标注，极大提升了内容创作效率。
普惠生态:价格仅为 Gemini 的十分之一
阿里云百炼平台已同步上线 Plus、Flash、Light 三种 API，旨在为企业提供最具性价比的选择:
成本极低: 每百万 Tokens 输入成本低于0.8元，价格不到 Gemini-3.1Pro 的十分之一。
市场领先: 目前千问已服务超100万家客户，稳居中国企业级大模型调用市场第一。
结语:从“理解文字”到“感知世界”
Qwen3.5-Omni 的发布，不仅是阿里技术实力的展现，更是国产大模型迈向“全能交互”的重要里程碑。当模型能够像人类一样听懂方言、看懂草图、理解情绪，AI 将真正从屏幕里的对话框走出来，成为各行各业触手可及的超级生产力工具。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

网络媒体论坛郑州启幕，腾讯以AI为纽带，共建向上向善数字生态

大模型能力技术培训让数据智能像水电一样简单-数巅科技

华为：2026智慧公路F5G全光通信网白皮书

雷军：小米AI人才招聘专项正式启动

于东来回应退休：表面退休了，实际还是不退

直击博鳌 AI大模型如何“卷”向物理世界？

全站最新

网络媒体论坛郑州启幕，腾讯以AI为纽带，共建向上向善数字生态

大模型能力技术培训让数据智能像水电一样简单-数巅科技

华为：2026智慧公路F5G全光通信网白皮书

雷军：小米AI人才招聘专项正式启动

热门推荐

网络媒体论坛郑州启幕，腾讯以AI为纽带，共建向上向善数字生态

大模型能力技术培训让数据智能像水电一样简单-数巅科技

华为：2026智慧公路F5G全光通信网白皮书

雷军：小米AI人才招聘专项正式启动

OpenAI关停Sora真实原因曝光：烧钱无底洞用户留不住

苹果AI国行版凌晨意外上线后被迅速撤下

蚂蚁灵波开源大规模空间感知数据集

特斯拉Cybercab高管又走1名项目经理已在上月离开

Uber优步宣布收购全球专车服务预订平台Blacklane

因被指存在偏见，特拉华州一法官主动回避涉马斯克案件

百度击败谷歌！PaddleOCR成GitHub最受欢迎OCR项目：中国开源首度登顶

科技行业掀大规模裁员潮！员工成AI训练燃料：被裁前最后一刻还在帮助公司优化AI

DeepMind之父坦言：我造的AI可能灭绝人类但已无人能停下

追赶台积电！Rapidus提速1nm研发力争差距仅6个月

于东来回应退休：表面退休了，实际还是不退