当前位置：首页 » 资讯 » 新科技 » 正文

千问上线Qwen3.5-Omni 具备全模态感知与生成能力

IP属地中国·北京 编辑：赵磊凤凰网科技 时间：2026-03-31 04:05:27

3月30日，千问宣布上线Qwen3.5-Omni。Qwen3.5-Omni系列包含Plus、Flash、Light三种尺寸的Instruct版本，支持256k长上下文，模型支持超过10小时的音频输入及超过 400 秒的720P（1 FPS）音视频输入。Qwen3.5-Omni能够支持113种语种和方言的语音识别和36种语种和方言的语音生成，目前可通过Offline API和Realtime API进行体验。
据介绍，千问着重加强了Qwen3.5-Omni的交互能力。对比Qwen3-Omni ，Qwen3.5-Omni 在长上下文、多语言、音视频理解能力上都有明显提升，能够支持113种语种和方言的语音识别和36种语种和方言的语音生成，同时新增了语义打断、音色克隆、语音控制等实时交互能力，让对话体验更接近真人。配合 ARIA 技术，语音输出的稳定性和自然度也进一步改善。
Qwen3.5-Omni-Plus 在音频/音视频的理解、推理和交互任务上，共取得 215 项 SOTA 成绩，涵盖音视频、音频、语音识别、语音翻译等多个方向。其中，通用音频理解、推理、识别、翻译、对话全面超越 Gemini-3.1 Pro，音视频理解能力总体达到 Gemini-3.1 Pro 水平。同时，视觉和文本能力与同尺寸 Qwen3.5 模型持平。

标签：能力语音 音视频 语种方言对话体验音频 理解能力 视觉尺寸文本模型模态音色克隆小时真人科技 凤凰网 上线语义语言总体持平版本水平 据介绍 全面成绩技术稳定

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

CJ2026京东展区大揭秘：新潮数码与前沿科技共筑玩家乐园

韩寒出任荣耀影像创想家荣耀Robot Phone发布会定档8月12日

全站最新

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

热门推荐

美的等入股钧舵机器人

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

字节跳动在中卫成立新科技公司注册资本22亿

字节跳动在中卫成立新科技公司注册资本22亿

SpaceX财报前夕：轨道AI数据中心成估值关键，技术挑战与前景几何？

小米“食言”入局增程赛道，澎程系列SUV能否在激烈竞争中突围？

小米米家智能茶吧机台面式开启预售，双区出水精准控温，599元享便捷饮水煮茶体验

红杉资本深度对话：Transformer架构遇瓶颈，持续学习新架构或成AGI关键

MiniMax H3开源来袭：价格优势叠加技术突破，视频生成赛道迎新变局？

《2026 Q2热搜品牌TOP50》揭晓：自助餐、科技消费等新风口崛起，本土品牌发力

字节跳动Seedance 2.5发布：视频时长延长至30秒，多素材创作能力大幅提升

字节跳动Seedance 2.5发布：长叙事多模态编辑升级，赋能视频创作新体验