近日,人工智能公司 Inworld 正式发布了其最新的文本转语音模型 TTS-1.5。该模型以其自然、富有表现力的实时语音而备受关注,能够在低延迟的情况下提供多语言支持。
根据官方介绍,TTS-1.5的使用成本约为每分钟0.005美元,声称比市场上的同类产品便宜25倍,这一价格无疑将吸引大量用户的关注。
TTS-1.5在技术上实现了低于250毫秒的实时延迟,这意味着用户可以在对话中几乎感觉不到任何延迟。语音合成技术的提升,不仅在速度上有了显著改善,模型在表达力和稳定性方面也进行了优化。这为各种应用场景,尤其是游戏和虚拟现实领域的对话系统提供了新的可能性。
除了极具竞争力的价格,用户对低延迟的需求也在不断上升。许多用户认为,延迟是文本转语音技术面临的一大挑战。如今,Inworld 的这一创新成果为实现更真实的对话体验铺平了道路。用户在社交平台上对这一技术表现出了浓厚的兴趣,并期待能在自己的项目中应用这一新模型。
划重点:





京公网安备 11011402013531号