12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。

其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。


12月10日,面壁智能宣布,VoxCPM 1.5版本正式上线并开源,多项核心能力升级。

其中,AudioVAE采样率从16kHz提升至44.1kHz,模型可根据高质量音频,克隆效果更佳、细节更丰富的声音;此外,VoxCPM 1.5仅需6.25个token即可生成1秒音频,较此前版本提高一倍,在保持速度的同时提升了音频生成质量。同时,VoxCPM 1.5版本稳定性增强,减少音频伪影,优化长文本音频的生成效果。


免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
热门推荐