当前位置：首页 » 资讯 » 新科技 » 正文

阿里通义百聆推出新版语音模型：3秒录音“复制”9种语言18种方言

IP属地中国·北京 IT之家 时间：2025-12-15 18:22:17

IT之家 12 月 15 日消息，今天下午，通义大模型通过官方公众号宣布，两款“百聆”语音模型正式开源，两款模型迎来升级。根据介绍，其只需 3 秒录音，就能让你的声音无缝切换语种、方言与情绪 —— 普通话、粤语、日、英、开心、愤怒……9 种通用语言、18 种方言，通通搞定。
升级Fun-CosyVoice3 模型升级：首包延迟降低 50%，中英混字准确率翻倍，支持 9 语种 18 方言口音、跨语种克隆与情感控制；Fun-ASR 模型能力增强：噪声场景准确率 93%、支持歌词与说唱识别、31 语种自由混说、方言口音覆盖，并将流式识别模型的首字降低到 160ms。开源Fun-CosyVoice3（0.5B）开源：提供 zero-shot 音色克隆能力，支持本地部署与二次开发；Fun-ASR-Nano（0.8B）开源：Fun-ASR 的轻量化版本，推理成本更低，模型开源，支持本地部署与定制化微调。
IT之家从官方获悉，本次，Fun-CosyVoice3 大模型完成多项关键升级：
首包延迟降低 50%，支持双向流式合成，真正实现“输入即发声”，适用于语音助手、直播配音、无障碍阅读等实时场景；中英混说词错误率（WER）相比之前降低 56.4%，不论是含专业术语、大小写混排，还是语码转换的句子，都能精准、自然地发音；在 zero-shot TTS 评测中，内容一致性与音色相似度全面提升，复杂场景（test-hard）字符错误率（CER）相对降低 26%，接近人类录音水平；9 种通用语言、18 种中文方言、9 种情感控制，并具备跨语种音色复刻能力 —— 用一段普通话录音，即可生成粤语、日语、英语等语音，音色保持高度一致。
而开源的 Fun-CosyVoice3-0.5B 模型提供了 zero-shot 音色克隆能力，只需要你提供一段 3 秒以上的参考音频，即可复刻其音色并合成新语音，并且支持本地部署和二次开发。
Fun-ASR 号称能让 AI “听得懂”。其基于数千万小时真实语音数据训练，已在钉钉“AI 听记”、视频会议等场景中大规模落地。官方表示，该模型重点优化了嘈杂环境鲁棒性、多语言自由混说、中文方言与口音覆盖、歌词识别、定制化能力，并将流式识别模型的首字降低到 160ms。

Fun-CosyVoice3-0.5B 开源地址：
https://github.com/FunAudioLLM/CosyVoice（GitHub）https://funaudiollm.github.io/cosyvoice3/（GitHub.io）https://www.modelscope.cn/studios/FunAudioLLM/Fun-CosyVoice3-0.5B（体验 demo）https://modelscope.cn/models/FunAudioLLM/Fun-CosyVoice3-0.5B-2512（国内模型仓库）https://huggingface.co/FunAudioLLM/Fun-CosyVoice3-0.5B-2512（海外模型仓库）
Fun-ASR-Nano-0.8B 开源地址：
https://github.com/FunAudioLLM/Fun-ASR（GitHub）https://funaudiollm.github.io/funasr/（GitHub.io）https://modelscope.cn/studios/FunAudioLLM/Fun-ASR-Nano/（国内体验 demo）https://huggingface.co/spaces/FunAudioLLM/Fun-ASR-Nano（海外体验 demo）https://modelscope.cn/models/FunAudioLLM/fun-asr-nano-2512（国内模型仓库）https://huggingface.co/FunAudioLLM/Fun-ASR-Nano-2512（海外模型仓库）

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

以赛促业，AI冲击下的就业“突围”

留给豆包手机的盟友不多了

股价突然跳水，大跌超23%！网传联合创始人走私英伟达AI服务器被捕，上市公司紧急回应

Counterpoint Research：春节促销期间中国智能手机销量同比下降2% 存储供应紧张对整机厂商构成压力

苹果再向中国发展研究基金会捐款

小米汽车卷入专利争议！20人“老头乐小厂”为何进攻“巨头”？

全站最新

以赛促业，AI冲击下的就业“突围”

留给豆包手机的盟友不多了

股价突然跳水，大跌超23%！网传联合创始人走私英伟达AI服务器被捕，上市公司紧急回应

Counterpoint Research：春节促销期间中国智能手机销量同比下降2% 存储供应紧张对整机厂商构成压力

热门推荐

以赛促业，AI冲击下的就业“突围”

留给豆包手机的盟友不多了

股价突然跳水，大跌超23%！网传联合创始人走私英伟达AI服务器被捕，上市公司紧急回应

视频创作全链垂类智能体万兴ReelClaw将上线

天融信发布大模型多模态安全防护网关

Counterpoint Research：春节促销期间中国智能手机销量同比下降2% 存储供应紧张对整机厂商构成压力

苹果再向中国发展研究基金会捐款

小米汽车卷入专利争议！20人“老头乐小厂”为何进攻“巨头”？

何小鹏：IRON机器人今年底量产月产能目标超1000台

雷军，只给笔记本留了十多分钟

用AI，“再造”一个阿里

小米汽车谈为何未公布新一代SU7大定量：锁单量数据“更真实”

干细胞“智造”胰岛！1型糖尿病治疗迎曙光

背刺是一种癌，引发老车主变身黑粉头子

人形机器人之外：一场关于“人作为劳动力”的替代正在发生