当前位置: 首页 » 资讯 » 新科技 » 正文

MiniMax Speech 2.5语音生成模型上线:多语种表现力更强

IP属地 中国·北京 编辑:冯璃月 Chinaz 时间:2025-08-07 10:30:08

MiniMax今日宣布推出新一代语音生成模型Speech2.5,这一升级版模型在全球语音技术领域再次树立了新的标杆,进一步巩固了其作为全球最强语音模型的地位。Speech2.5在多语种表现力、音色复刻以及语种覆盖范围等方面均实现了显著提升。

与今年5月发布的Speech02相比,Speech2.5在多语种表现力上取得了飞跃性进步,尤其在中文方面继续保持全球最强水平,同时英文及其他多语种的表现也得到了全面提升。该模型在字错率、相似度和自然韵律度等方面均超越了前代产品,用户可以在40种语言之间轻松切换,无论是商务会议、日常对话还是英文播客,都能提供更加自然流畅的语音体验,彻底摆脱了以往语音合成中常见的“机械感”。

在音色复刻方面,Speech2.5达到了行业天花板级的精度。它不仅能够跨语种复刻口音,还能保留同语种不同地区的口音特色,甚至能够精准复刻特殊年龄的声音。无论是在极限场景下,还是在跨语种切换时,Speech2.5都能保持高度逼真的音色细节。例如,用英国女王的经典发音来介绍Speech2.5,模型能够完美还原其独特的停顿、节奏和发音处理,甚至在意大利语和英语之间切换时,依然能够保留口音特色。

此外,Speech2.5的多语种覆盖范围也从之前的版本大幅扩展至40个语种,新增了包括保加利亚语、丹麦语、希伯来语、马来语、波斯语、斯洛伐克语、瑞典语、克罗地亚语、菲律宾语、匈牙利语、挪威语、斯洛文尼亚语、加泰罗尼亚语、尼诺斯克、泰米尔语和阿非利卡语等在内的多种语言。这一扩展使得Speech2.5在全球化内容创作中更具优势,无论是跨境电商、出海客服还是本地化营销,用户都能一键生成高质量的多语种语音内容。

Speech2.5的推出为多个行业带来了巨大的便利和创新机会。对于企业客户而言,多语种客服和跨国广告配音的成本将大幅降低,以往需要高昂费用和长时间制作的全球产品宣传片配音,如今只需10分钟即可生成。对于创作者来说,逼真的个人声线复刻功能使他们能够轻松制作全球短视频爆款,实现一人开口说40国语言的创意表达。教育者也从中受益,小众语言课件的制作周期从数周缩短至10分钟,跨国方言教材的定制也变得更加便捷。

Speech2.5在Speech02的基础上再次升级,不仅延续了全球最高的性价比,还进一步提升了性能。目前,MiniMax Speech语音模型已在全球范围内被广泛采用,包括海外的Vapi、Pipecat等Agent平台,以及Hedra、Icon、Syllaby等头部AI应用,国内的高途教育、喜马拉雅、网易、Rokid眼镜等头部平台及产品也纷纷接入MiniMax Speech。

MiniMax开放平台:

minimaxi.com/platform_overview

MiniMax Audio:

minimaxi.com/audio

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。