当前位置：首页 » 资讯 » 新科技 » 正文

千问上线Qwen3.5-Omni 具备全模态感知与生成能力

IP属地中国·北京 编辑：孙明凤凰网科技 时间：2026-03-30 22:36:43

3月30日，千问宣布上线Qwen3.5-Omni。Qwen3.5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本，支持256k长上下文，模型支持超过10小时的音频输入及超过 400 秒的720P（1 FPS）音视频输入。Qwen3.5-Omni能够支持113种语种和方言的语音识别和36种语种和方言的语音生成，目前可通过Offline API和Realtime API进行体验。
据介绍，千问着重加强了Qwen3.5-Omni的交互能力。对比Qwen3-Omni ，Qwen3.5-Omni 在长上下文、多语言、音视频理解能力上都有明显提升，能够支持113种语种和方言的语音识别和36种语种和方言的语音生成，同时新增了语义打断、音色克隆、语音控制等实时交互能力，让对话体验更接近真人。配合 ARIA 技术，语音输出的稳定性和自然度也进一步改善。
Qwen3.5-Omni-Plus 在音频/音视频的理解、推理和交互任务上，共取得 215 项 SOTA 成绩，涵盖音视频、音频、语音识别、语音翻译等多个方向。其中，通用音频理解、推理、识别、翻译、对话全面超越 Gemini-3.1 Pro，音视频理解能力总体达到 Gemini-3.1 Pro 水平。同时，视觉和文本能力与同尺寸 Qwen3.5 模型持平。

标签：语音音频语种 语音识别 qwen 方言 音视频 gemini

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

贾跃亭宣布法拉第未来月底将超额完成机器人首月20台交付目标

豪威集团：2026年一季度营收同比减少0.03%-4.51%

宇树科技CEO：机器人任意动作生成、自主出招对打，六个月后可实现

深圳华强北现内存条抛售行情有商户称部分型号一周降价近三成

爱奇艺公告：拟在港交所上市

中科宇航力箭二号首飞后将推进可回收技术相关研发和验证

全站最新

贾跃亭宣布法拉第未来月底将超额完成机器人首月20台交付目标

豪威集团：2026年一季度营收同比减少0.03%-4.51%

宇树科技CEO：机器人任意动作生成、自主出招对打，六个月后可实现

深圳华强北现内存条抛售行情有商户称部分型号一周降价近三成

热门推荐

企业微信 CLI 正式开源:开放七大核心能力，支持主流 AI Agent 直接调用

DeepSeek已恢复服务：此前公告服务出现重大中断

OPPO K15 Pro搭载新一代疾风散热引擎散热效率提升3倍

贾跃亭宣布法拉第未来月底将超额完成机器人首月20台交付目标

豪威集团：2026年一季度营收同比减少0.03%-4.51%

宇树科技CEO：机器人任意动作生成、自主出招对打，六个月后可实现

深圳华强北现内存条抛售行情有商户称部分型号一周降价近三成

爱奇艺公告：拟在港交所上市

中科宇航力箭二号首飞后将推进可回收技术相关研发和验证

vivo X300s发布：6.78英寸144Hz大屏+蔡司2亿像素主摄，4999元起

高德地图无网导航全新升级：覆盖驾车、公交、步行等全场景

vivo X300 Ultra发布：四颗后置镜头+6600mAh蓝海电池售价6999元起

小鹏智驾误判红灯急刹，导致三车追尾！交警：后车全责

中科宇航详解力箭二号：我国未来大规模星座组网主力运载火箭

继“骂消费者像狗”后，罗技商店页面竟现狗爪配图