当前位置: 首页 » 资讯 » 新科技 » 正文

字节跳动发布Seedance 1.5 pro模型,支持音视频联合生成

IP属地 中国·北京 编辑:赵磊 凤凰网科技 时间:2025-12-16 22:08:12

12月16日,字节跳动发布新一代音视频生成模型Seedance 1.5 pro。该模型支持从文本或图像生成带有同步音频的视频,实现了音视频的联合生成。

据介绍,Seedance 1.5 pro在音画同步方面进行了优化,旨在提升生成内容中口型、语调与表演节奏的一致性。模型支持包括中文、英文、日文在内的多语种,并可模拟四川话、粤语等方言的语音特征。在视频层面,该模型声称具备一定的自主运镜调度能力,可生成如长镜头跟随、希区柯克式变焦等效果,以增强画面的动态张力与叙事感。

技术层面,该模型采用了基于MMDiT架构的音视频联合生成框架,并通过多阶段数据链路与强化学习方式进行优化。团队表示,其已在影视创作、广告制作、短剧及游戏内容等场景中进行测试,生成内容在指令遵循、音质表现等方面有所提升,但在复杂运动的物理稳定性、多角色对话等方面仍有改进空间。

标签: 模型 音视频 方面 内容 视频 层面 画面 角色 日文 短剧 方言 希区柯克 音质 语音 游戏 特征 稳定性 中文 对话 效果 运镜 阶段 方式 调度 数据链 团队 能力 语调 广告 张力 动态 节奏

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。