当前位置：首页 » 资讯 » 新科技 » 正文

通义发布并开源首个支持影视级多场景配音的多模态大模型

IP属地中国·北京 财闻 时间：2026-03-16 16:29:52

3月16日，通义实验室发布并开源了首个支持影视级多场景配音的多模态大模型 Fun-CineForge。此外，还配套开放了高质量数据集的构建方法。通过“数据 + 模型”的一体化设计，Fun-CineForge 正尝试解决影视级 AI 配音长期面临的关键问题。
据介绍，Fun-CineForge 首先构建了一套自动化的数据集生产流程，可以将原始影视素材转化为结构化多模态数据。
该流程包括人声分离、文本转录、长视频分段、音视频联合说话人分离等，其中，基于通用大模型思维链的双向矫正机制，大幅降低了转录文本和说话人分离结果的错误率。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

ISLE 2026成功引领智慧显示与系统集成新趋势

三部门：到2030年全国燃料电池汽车保有量较2025年翻一番力争达到10万辆

淘宝闪购申请蜂鸟车电商标

数智赋能巴渝大地重庆信息通信业交出2025年高质量发展答卷

iOS 27 和 macOS 27 最新内部版本依然专注于 Liquid Glass 界面

苹果争取在 iOS 27 中实现系统级“Liquid Glass”滑块功能

全站最新

ISLE 2026成功引领智慧显示与系统集成新趋势

三部门：到2030年全国燃料电池汽车保有量较2025年翻一番力争达到10万辆

淘宝闪购申请蜂鸟车电商标

数智赋能巴渝大地重庆信息通信业交出2025年高质量发展答卷

热门推荐

ISLE 2026成功引领智慧显示与系统集成新趋势

三部门：到2030年全国燃料电池汽车保有量较2025年翻一番力争达到10万辆

新华读报｜科学家尝试用鱼鳞研发人造角膜

淘宝闪购申请蜂鸟车电商标

数智赋能巴渝大地重庆信息通信业交出2025年高质量发展答卷

iOS 27 和 macOS 27 最新内部版本依然专注于 Liquid Glass 界面

苹果争取在 iOS 27 中实现系统级“Liquid Glass”滑块功能

iOS 27 与 Snow Leopard 类似首要任务是提升性能和稳定性

中国大模型90后第一人将亮相英伟达GTC，揭秘Kimi技术突破

三星MX事业部拉响警报，恐迎首次亏损！

打字高手专属：HHKB推出无刻印版键盘/键帽

iPhone Fold将采用宽屏设计对标iPad mini，苹果以差异化设计切入折叠屏市场

OpenAI联合创始人分析揭示：高收入职业面临更高AI替代风险

ASML裁员1700人计划引发内部动荡，工会质疑重组紧迫性

禾芯动力AWE首秀发布农业机器人矩阵