当前位置：首页 » 资讯 » 新科技 » 正文

Qwen3-TTS全家桶开源上线

IP属地中国·北京 证券时报 时间：2026-01-23 10:21:20

Qwen3-TTS全家桶开源上线，Qwen3-TTS是由Qwen开发并已开源的全系列语音生成模型，提供1.7B（追求极致性能和强大控制）和0.6B（平衡性能与效率）两种尺寸模型，支持中文、英文、日语、韩语、德语、法语等10种主流语言及多种方言音色，满足全球应用需求。
全面支持音色克隆、音色创造和超高质量拟人化语音生成。支持自然语言指令驱动的语音生成，灵活调控音色、情感、韵律等声学属性。具备强大的上下文理解能力，可根据指令和文本语义自适应调整语气、节奏与情感表达，并提升对输入文本噪声的鲁棒性。
基于创新的Dual-Track混合流式生成架构，单模型同时兼容流式与非流式生成，最快可在输入单字后即刻输出音频首包，端到端合成延迟低至97ms，满足实时交互需求。
Qwen3-TTS-VoiceDesign在InstructTTS-eval中指令遵循能力和表现力超越MiniMax-Voice-Design和其他开源模型。Qwen3-TTS-Instruct具备单人多语言泛化能力（平均词错率2.34%）、保持音色风格控制能力（InstructTTS-eval 75.4%）及卓越的长语音生成能力（10分钟语音中英词错率2.36%/2.81%）。Qwen3-TTS-VoiceClone 在中英文克隆稳定性、多语种测试集平均词错误率和说话人相似度上超越MiniMax和ElevenLabs。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

4600万AI大单！火山引擎中

蔚来乐道L90新增“马到成功版”，29.68万元起/租电21.08万元起

腾讯不想靠“token生意”赚快钱

“增长势头惊人”！美媒：马斯克认为制约美国AI发展的最大瓶颈，是中国完全无需应对的问题

闲鱼卖家售“基金投资指南”引集体投诉律师：平台应严格审查卖家资质，杜绝违规销售

智能驾驶安全闭环：新思科技从IP到SLM的端到端防护策略

全站最新

4600万AI大单！火山引擎中

蔚来乐道L90新增“马到成功版”，29.68万元起/租电21.08万元起

腾讯不想靠“token生意”赚快钱

“增长势头惊人”！美媒：马斯克认为制约美国AI发展的最大瓶颈，是中国完全无需应对的问题

热门推荐

REDMI Turbo 5 Max官宣下周发布

达沃斯现场直击：松鼠Ai梁静炮轰“教育AI泡沫”，大模型套壳岂能教好书？

马斯克达沃斯首秀:Optimus 机器人2027年公售，将开启“家庭标配”时代

GPT-5.2 核心注入！OpenAI 编程神器 Codex 杀入 JetBrains 全家桶，开发者效率起飞

拒绝只当“传话筒”！苹果 iOS 27 重塑 Siri：进化为全能型 AI 聊天机器人

4600万AI大单！火山引擎中

蔚来乐道L90新增“马到成功版”，29.68万元起/租电21.08万元起

腾讯不想靠“token生意”赚快钱

“增长势头惊人”！美媒：马斯克认为制约美国AI发展的最大瓶颈，是中国完全无需应对的问题

闲鱼卖家售“基金投资指南”引集体投诉律师：平台应严格审查卖家资质，杜绝违规销售

智能驾驶安全闭环：新思科技从IP到SLM的端到端防护策略

现有路径不通？OpenAI、亚马逊考虑改变大模型训练方式

乐道L90推出马年特别版，售价29.68万元起

浙江移动搭建AI监管平台解决电焊作业防火难题

黄仁勋：AI时代蓝领能拿六位数薪水，不需要拥有计算机博士学位