当前位置：首页 » 资讯 » 新零售 » 正文

Nari Labs 开源 16 亿参数文字转语音模型 Dia，支持精细化调节

IP属地中国·北京 编辑：江紫萱 IT之家 时间：2025-05-16 18:17:20

4 月 24 日消息，由两名韩国研究者组建的 Nari Labs 工作室于前天在 GitHub 和 Hugging Face 开源了拥有 16 亿参数的文字转语音 AI 模型 Dia，目前相应模型已在 GitHub 上收获了超过 9300 颗星标，附项目 GitHub 页如下：https://github.com/nari-labs/dia
相应研究者声称 Dia 的音质相对于业界的文字转语音模型拥有更灵活的自由度，同时在生成的语音自然度方面超越了 ElevenLabs Studio、Sesame 等竞品。其支持对输出音频的音色、情绪和语调进行精细调节，还能模拟各种非语言交流（如大笑、咳嗽或清嗓子等）。
官方对比测试显示，Dia 在声调自然度、表情丰富度和语音节奏感方面，均优于专注自然语音合成的 ElevenLabs Studio 以及 Sesame 推出的对话语音模型 CSM-1B。
目前，Dia 仅支持英文，需要英伟达 RTX 3080 及以上显卡才能本地部署运行，不过用户也可以在 Hugging Face Spaces 线上平台中在线使用。Nari Labs 表示，后续将推出面向普通消费者的一键部署服务，进一步降低使用门槛，让更多人无缝体验高质量文本转语音技术。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

“吃+喝”大文章

6月1日开始入户调查，每家每户都可能轮到，请积极配合

体验千问内淘宝后，我发现自己低估了AI购物

杭州一街道被电商拉黑背后，一场由“无理由退货”引爆的规则战争

3000亿宠物市场“还远未到内卷的程度”，淘天宠物已孵化60多个过亿品牌

史上最离谱：CEO卖袜子筹3810亿，买电商鼻祖

全站最新

智谱宣布GLM-5.2面向GLM Coding Plan全量用户开放

标致“纯电小钢炮”E-208 GTi发布：281马力5.5秒破百，42900欧元

首尔禁止中小学生戴AI眼镜参加期末考试，否则将一律按作弊处理

江淮汽车总经理李明：要让尊界等优秀产品惠及全球用户

热门推荐

彭博：中国汽车正在“占领”从巴西到南非的每一条道路

“吃+喝”大文章

6月1日开始入户调查，每家每户都可能轮到，请积极配合

体验千问内淘宝后，我发现自己低估了AI购物

杭州一街道被电商拉黑背后，一场由“无理由退货”引爆的规则战争

3000亿宠物市场“还远未到内卷的程度”，淘天宠物已孵化60多个过亿品牌

百联股份：公司已成功发行华安百联消费REIT，并正推进扩募储备

史上最离谱：CEO卖袜子筹3810亿，买电商鼻祖

阿里财报：Q4云外部收入增长加速至40%，电商CMR增长8%

夯爆了的年轻人，正在吃透百元购买力

马光远：现在的市场的确像极了1999年泡沫破灭前

市场监管总局：一季度全国新设经营主体509.8万户

国机汽车：全资子公司签署1.09亿元经营合同

长鹰硬科即将上会：两名创始股东退出董监，2025年经营现金流转负

机构：一季度国内消费级XR市场销量同比增长63%