当前位置：首页 » 资讯 » 新科技 » 正文

美团LongCat-Video视频生成模型发布：可输出5分钟长视频

IP属地中国·北京 编辑：陈阳凤凰网科技 时间：2025-10-27 12:15:01

10月27日，美团官方宣布，美团LongCat团队正式发布LongCat-Video视频生成模型。该模型基于Diffusion Transformer架构，可支持文生视频、图生视频及视频续写三类核心任务，并宣称在开源模型中达到先进水平。
据介绍，LongCat-Video可生成720p分辨率、30帧率的高清视频，其突出特点在于能够原生生成长达5分钟的连贯视频内容。模型通过视频续写预训练、块稀疏注意力等机制，旨在解决长视频生成中常见的画面断裂、质量下降等问题，保持时序一致性与运动合理性。
在效率方面，该模型采用二阶段生成、块稀疏注意力及模型蒸馏等技术，据官方表示推理速度提升超过10倍。模型参数量为136亿，在VBench等公开测试中表现出较强的文本对齐与运动连贯性。
作为构建世界模型的技术尝试，LongCat-Video未来或可应用于自动驾驶模拟、具身智能等需要长时序建模的场景。该模型的发布标志着美团在视频生成与物理世界模拟领域迈出重要一步。

标签：视频模型美团时序 合理性 问题官方 连贯性 文本世界 一致性 质量内容场景方面效率物理水平 注意力 连贯特点标志图生建模领域技术科技核心 凤凰网 任务画面据介

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

CJ2026京东展区大揭秘：新潮数码与前沿科技共筑玩家乐园

韩寒出任荣耀影像创想家荣耀Robot Phone发布会定档8月12日

全站最新

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

热门推荐

美的等入股钧舵机器人

DeepSeek又更新了，这次梁文锋没放大招｜进击的独角兽

小米VS华为！澎程新车对标问界，智界RX盯上小米YU7

出走米哈游1000多天后，蔡浩宇的AI远征“撞墙”

华为深圳场景化解决方案发布，破解“模型强、场景弱”难题

字节跳动在中卫成立新科技公司注册资本22亿

字节跳动在中卫成立新科技公司注册资本22亿

SpaceX财报前夕：轨道AI数据中心成估值关键，技术挑战与前景几何？

小米“食言”入局增程赛道，澎程系列SUV能否在激烈竞争中突围？

小米米家智能茶吧机台面式开启预售，双区出水精准控温，599元享便捷饮水煮茶体验

红杉资本深度对话：Transformer架构遇瓶颈，持续学习新架构或成AGI关键

MiniMax H3开源来袭：价格优势叠加技术突破，视频生成赛道迎新变局？

《2026 Q2热搜品牌TOP50》揭晓：自助餐、科技消费等新风口崛起，本土品牌发力

字节跳动Seedance 2.5发布：视频时长延长至30秒，多素材创作能力大幅提升

字节跳动Seedance 2.5发布：长叙事多模态编辑升级，赋能视频创作新体验