当前位置：首页 » 资讯 » 新科技 » 正文

微软发布 DragonV2.1 模型，AI 转录语音更自然、更富表现力

IP属地中国·北京 编辑：冯璃月 IT之家 时间：2025-07-31 14:19:09

IT之家 7 月 31 日消息，科技媒体 NeoWin 今天（7 月 31 日）发布博文，报道称微软推出了 DragonV2.1Neural 零次学习（Zero-Shot Learning）模型，仅凭少量数据就能创建更加自然、表现力强的声音，并支持超过 100 种语言。
IT之家援引博文介绍，这是一种零次学习的文本到语音（TTS）模型，承诺提供更加自然和富有表现力的声音，并提高了发音的准确性以及增强了可控性。
新模型仅需几秒钟的语音样本即可合成超过 100 种语言的语音。相比之下，之前的 DragonV1 模型在处理专有名词时存在发音问题。DragonV2.1 模型可以应用于多种不同场景，包括定制聊天机器人声音和为视频内容跨多语言配音。
微软表示，DragonV2.1 提高发音准确性，与 DragonV1 相比，该模型单词错误率（WER）平均降低了 12.8%。

该模型还提升了声音的自然度，用户使用此模型时，可以利用 SSML 音素标签和自定义词典对发音和口音进行细致控制。为了帮助用户入门，微软构建了 Andrew、Ava 和 Brian 等多个声音档案，供用户测试。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

宝马最大纯电旗舰SUV全新iX7谍照曝光，至少10万美元起售

别再迷信伪智能了：为什么系统越买越贵，公司却越来越乱？

PS3模拟器RPCS3实现SPU模拟突破，游戏帧率有望提升5%至7%

刚刚，Claude 4小时血洗全球最安全系统！人类最后防线失守

上海老牌国企要造“AI算力心脏”，一群32岁年轻人造出国内第一批万卡集群

“死在戈壁滩，埋在青山头” 航天英烈长眠在“东风”土地

全站最新

宝马最大纯电旗舰SUV全新iX7谍照曝光，至少10万美元起售

别再迷信伪智能了：为什么系统越买越贵，公司却越来越乱？

PS3模拟器RPCS3实现SPU模拟突破，游戏帧率有望提升5%至7%

刚刚，Claude 4小时血洗全球最安全系统！人类最后防线失守

热门推荐

胖东来再回应鸡蛋角黄素风波：多品牌鸡蛋均合格，追责不实言论

青岛9部门联合发布工作方案，推动建设57个过亿元规模汽车产业项目

索尼再度清理PlayStation商店，多款粗制滥造游戏遭下架

华境S大六座SUV官宣上市即支持城区领航辅助，首批搭载华为乾崑舱内激光视觉Limera

张雪机车打假冒充账号：张雪本人暂未在小红书开通账号

新一代SU7可设置仅解锁主驾车门：对长期单独用车人士更有安全感

全球能源价格攀升！国产电摩成海外香饽饽东南亚抢着买

雷军晒图庆祝小米创办16周年！16年老员工感恩：生日快乐永远相信美好的事情即将发生

宝马最大纯电旗舰SUV全新iX7谍照曝光，至少10万美元起售

别再迷信伪智能了：为什么系统越买越贵，公司却越来越乱？

PS3模拟器RPCS3实现SPU模拟突破，游戏帧率有望提升5%至7%

刚刚，Claude 4小时血洗全球最安全系统！人类最后防线失守

东北师范大学科研人员拍到青头潜鸭珍贵画面

上海老牌国企要造“AI算力心脏”，一群32岁年轻人造出国内第一批万卡集群

“死在戈壁滩，埋在青山头” 航天英烈长眠在“东风”土地