上证报中国证券网讯(记者 罗茂林)4月10日,米哈游创始人蔡浩宇旗下AI公司Anuttacon在arXiv发布论文,公开其新一代视频生成模型LPM 1.0(Large Performance Model)。 据论文介绍,LPM 1.0是一个基于170亿参数扩散Transformer架构的视频模型,主打角色表演生成能力。与传统视频生成模型相比,该模型不仅关注画面生成,还尝试实现角色在视频中的连续表达,包括说话、倾听和实时反应,更注重于“表演”。 该模型可以根据输入图像生成具有稳定身份特征的视频角色,在对话过程中保持外观与行为一致,同时完成语音驱动、表情变化和动作反馈。 值得一提是,有媒体注意到,论文项目标注的Project Lead包括曾爱玲(Ailing Zeng)。其个人主页显示目前就职于Anuttacon。据悉,曾爱玲此前在腾讯混元团队及AI Lab从事计算机视觉与生成模型相关研究工作。
上证报中国证券网讯(记者 罗茂林)4月10日,米哈游创始人蔡浩宇旗下AI公司Anuttacon在arXiv发布论文,公开其新一代视频生成模型LPM 1.0(Large Performance Model)。
据论文介绍,LPM 1.0是一个基于170亿参数扩散Transformer架构的视频模型,主打角色表演生成能力。与传统视频生成模型相比,该模型不仅关注画面生成,还尝试实现角色在视频中的连续表达,包括说话、倾听和实时反应,更注重于“表演”。
该模型可以根据输入图像生成具有稳定身份特征的视频角色,在对话过程中保持外观与行为一致,同时完成语音驱动、表情变化和动作反馈。
值得一提是,有媒体注意到,论文项目标注的Project Lead包括曾爱玲(Ailing Zeng)。其个人主页显示目前就职于Anuttacon。据悉,曾爱玲此前在腾讯混元团队及AI Lab从事计算机视觉与生成模型相关研究工作。





京公网安备 11011402013531号