12月11日,智谱发布消息,上线并开源 GLM‑TTS工业级语音合成系统。据介绍,只需 3 秒语音样本,GLM‑TTS 即可学习说话人的音色和说话习惯。在通用朗读、情感配音、教育评测、电子书、有声客服等场景中,实现自然流畅、贴近真人的语音。
官方表示,GLM-TTS 仅使用 10w 小时训练数据,远低于行业主流商用模型。同时,GLM-TTS 也兼顾了训练成本和效果,预训练仅需要单机 4 天即可得到开源 SOTA“发音准确度”与超高“音色还原度”,精品音色 LORA 和强化学习也仅需要单机 1 天即可完成训练。此外,GLM‑TTS 还以更低的价格获得了行业领先的 MOS 分数。





京公网安备 11011402013531号