当前位置：首页 » 资讯 » 新科技 » 正文

阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换

IP属地中国·北京 编辑：陆辰风 Chinaz 时间：2025-12-15 18:24:54

阿里巴巴通义大模型宣布，其 “百聆” 系列语音模型迎来了重大升级，并正式开源。此次更新的两款语音模型，能够在仅需三秒的录音后，实现无缝切换至多达九种语言和十八种方言，包括普通话、粤语、日语、英语等，同时还可以模拟多种情感如开心和愤怒。
在这次升级中，Fun-CosyVoice3模型得到了显著改善。模型的首包延迟降低了50%，大幅提升了中英混说的准确率。此外，模型的音色克隆能力得到了增强，用户只需提供一段三秒以上的录音，便能复刻出相应的音色并合成新语音。此功能的开发使得实时语音助手、直播配音和无障碍阅读等场景变得更加高效和便捷。
Fun-ASR 模型的能力同样得到了提升，噪声环境下的准确率达到了93%。这一模型不仅支持歌词和说唱的识别，还可以进行多语言自由混说，覆盖多种中文方言与口音。为了提升用户体验，流式识别的首字延迟已降低至160毫秒，大幅提升了语音交互的流畅性。
此外，这两款模型均支持本地部署与二次开发，开发者可以根据自己的需求进行定制化调整。开源地址也已公布，用户可以前往相关平台体验和使用这两款语音模型，进一步推动语音技术在各个领域的应用。
GitHub:https://github.com/FunAudioLLM/CosyVoice
划重点:

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

小红书首届黑客松巅峰赛落幕，00后摘得全场大奖

《AI时代的商业进化蓝图（2026）》白皮书发布：企业不再为AI本身买单

蔚来李斌：自研芯片省不少钱，年销量瞄准50%增长率

天上“格斗”，地上“筑链”！无人机赛场，成都如何“领飞”？

顶尖大模型“能力突变”，算力需求“系统性超越供给”--大摩：“市场乐观的程度可能还不够”

京东吉利宁德时代入局聚势赋能，东北超赞助商产业联盟呼之欲出

全站最新

小红书首届黑客松巅峰赛落幕，00后摘得全场大奖

《AI时代的商业进化蓝图（2026）》白皮书发布：企业不再为AI本身买单

蔚来李斌：自研芯片省不少钱，年销量瞄准50%增长率

天上“格斗”，地上“筑链”！无人机赛场，成都如何“领飞”？

热门推荐

宇树科技移动机器人专利获授权发明人为王兴兴等

东营辉煌绿色锂电新材料产业投资基金成立出资额约12亿

郭艾伦企业已注册篮球训练营商标

起底直播间涉黄牛奶关联公司

浙江杭资科创创业投资基金登记成立出资额20.02亿

东方国信旗下内蒙古科技公司增资至10亿增幅100%

杨幂维权索赔5万

宁德时代在呼和浩特成立新科技公司注册资本1000万

中国通号旗下低空智能科技公司增资至8亿增幅约167%

金杯汽车、自变量机器人成立合资公司注册资本1500万

起底救护车违规转运患者涉事医院

黄景瑜起诉多方侵权

蔚来资本等入股灵猴机器人

招商创科等入股浙江人形机器人创新中心后者增资至6798万

小米申请注册YU7 GT商标

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

首页

新科技

新金融

新零售

智能车

房地产

科技探索

人物资讯

网络游戏

人工智能

专题

阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换

首页

资讯

财经号

智能车

专题

电商资讯

人物资讯

滚动资讯

​阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换

同类资讯

阿里推出新语音模型“百聆”：三秒录音实现多语言与情感切换