当前位置：首页 » 资讯 » 新科技 » 正文

字节跳动发布实验性扩散语言模型 Seed Diffusion Preview

IP属地中国·北京 编辑：陆辰风 Chinaz 时间：2025-08-01 10:37:22

字节跳动Seed团队宣布推出实验性扩散语言模型Seed Diffusion Preview，标志着在语言模型领域的一次重大技术突破。该模型旨在通过结构化的代码生成实验，验证离散扩散技术路线作为下一代语言模型基础框架的可行性。Seed Diffusion Preview在推理速度上取得了显著提升，达到每秒2146个tokens，相比同等规模的自回归模型提升了5.4倍，同时在多个代码生成基准测试中表现出与自回归模型相当的性能。
Seed Diffusion Preview的发布，旨在解决自回归（AR）模型在推理速度和全局控制方面的局限性。扩散模型通过从粗到精的生成范式，在图像和视频合成等连续数据领域取得了显著成功。然而，将扩散模型应用于自然语言等离散领域面临根本性挑战，主要在于标准扩散过程与离散状态空间的不兼容性。尽管如此，离散扩散模型在可扩展性和效果上已展现出巨大潜力。
为应对这些挑战，Seed Diffusion Preview采用了四项关键技术创新:两阶段课程学习、约束顺序扩散、同策略学习以及块级并行扩散采样方案。两阶段课程学习策略包括基于掩码的扩散训练和基于编辑的扩散训练，旨在提升模型的局部上下文补全能力和全局代码合理性评估能力。约束顺序扩散通过引入代码的结构化先验，引导模型掌握正确的依赖关系。同策略学习通过优化生成步数，提升模型的推理速度。块级并行扩散采样方案则在保持因果顺序的同时，实现了高效的块级推理。
实验结果显示，Seed Diffusion Preview在代码推理速度上达到了2146tokens/s，相比同等规模的自回归模型提升了5.4倍。这一速度提升并未以牺牲质量为代价，模型在多个业界基准上的性能与优秀的自回归模型相当，并在代码编辑等任务上实现了超越。这一成果不仅证明了离散扩散模型在推理加速方面的潜力，还展示了其在复杂推理任务中的应用前景。
项目页面:https://seed.bytedance.com/seed_diffusion
体验链接:https://studio.seed.ai/exp/seed_diffusion

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

商业航天，正在走向“可重复时代”

全球首个商务会议智能体在浦东“模力社区”发布，区域内已汇聚200多家垂类模型上下游企业

元宝红包口令已能够在微信中复制，还能分享至元宝派

阿维塔06T部分参数公布：首批搭载华为全新一代激光雷达

数字化教学方案获认证梨花教育AI声学学习机开启终身学习新体验

被欧盟认定存在上瘾式设计，TikTok回应

全站最新

商业航天，正在走向“可重复时代”

全球首个商务会议智能体在浦东“模力社区”发布，区域内已汇聚200多家垂类模型上下游企业

元宝红包口令已能够在微信中复制，还能分享至元宝派

阿维塔06T部分参数公布：首批搭载华为全新一代激光雷达

热门推荐

商业航天，正在走向“可重复时代”

全球首个商务会议智能体在浦东“模力社区”发布，区域内已汇聚200多家垂类模型上下游企业

元宝红包口令已能够在微信中复制，还能分享至元宝派

阿维塔06T部分参数公布：首批搭载华为全新一代激光雷达

数字化教学方案获认证梨花教育AI声学学习机开启终身学习新体验

被欧盟认定存在上瘾式设计，TikTok回应

破解AI时代“数字鸿沟”难题，浦东金海文化艺术中心有了这个全国首创

当AI技术涌入短剧漫剧创作会给数字文创产业带去哪些变化？

45亿互联网"红包大战"！AI巨头撒钱推应用抢市场

世界首富的烦恼：马斯克感叹“金钱买不到幸福”，两天浏览量破亿

日均烧掉 5 个亿！谷歌这份败家财报，把华尔街都给整不会了。

贴脸嘲讽ChatGPT后，这家公司又发了个最强模型。

闪崩！超级乌龙指！

事关成瘾性设计！欧盟调查TikTok，释放何种信号？

运城小程序开发，我的亲测案例分享