当前位置: 首页 » 资讯 » 新科技 » 正文

阿里通义语音双模型发布:一句话即可自由生成

IP属地 中国·北京 编辑:陈阳 凤凰网科技 时间:2026-03-02 14:29:33

3月2日,阿里通义实验室语音团队发布两款支持FreeStyle指令生成的模型Fun-CosyVoice3.5与Fun-AudioGen-VD

官方宣称,无论是精细控制声音表达,还是从零设计音色与场景,都可以通过自然语言指令直接生成

其中,Fun-CosyVoice3.5应用方向为多语种复刻+精细化表达控制:用户可以直接用自然语言描述表达方式,例如:“语气坚定一点”、“稍微压低音调,语速慢一点”、“带一点情绪起伏”...... 模型即可理解并生成相应表达。此外,针对生僻字、复杂语句等容易读错的场景专项优化,Fun-CosyVoice3.5生僻字读错率从15.2%降至5.3%,

Fun-AudioGen-VD则主打声音设计+场景化音频生成。支持根据自然语言描述,生成目标音色、情绪表达和完整听觉场景,此外,Fun-AudioGen-VD不仅能生成声音,还能生成声音所处的“世界”,打造沉浸式听觉场景。

标签: 场景 通义 语音 声音 精细化 模型 多语种 音色 科技 音调 语句 凤凰网 语速 生僻字 目标 情绪 所处 世界 主打 方向 用户 实验室 团队 音频 专项 指令

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。

全站最新