当前位置: 首页 » 资讯 » 新科技 » 正文

告别反复横跳,我用一张画布给AI视频创作配上了一条“流水线”

IP属地 中国·北京 编辑:冯璃月 硅星人 时间:2025-07-30 14:08:20


作者 | 黄小艺
邮箱 | huangxiaoyi@pingwest.com

今年的世界人工智能大会(WAIC),可能是史上最热闹的一届。

不仅展馆规模创下新高,超过800家企业带来了3000多项展品,线下参观人数也远超去年。而如果你也在现场,穿梭在拥挤的人潮中,你会发现有一个展台前总是被围得水泄不通,其中还夹杂着大量专程赶来的海外观众。


这个展台就是可灵AI。

这一次,之所以会被这些专业目光团团围住,并非是可灵AI的又一次基础模型能力飞跃,而是一个新功能——灵动画布的上线。


简单来说,这是一个节点式的创作画布,让你能像搭积木一样,将图片生成、视频生成、音频创作等环节自由串联,一口气完成整体创作,为创作者搭建起了一条专业流水线。

这个新功能精准地戳中了AI创作者的痛处:我们能轻易生成无数惊艳的5秒片段——飞龙、赛博都市、雨中回眸——但它们却很难串联成一个完整的故事。在过去很长一段时间,创作者都因此陷入“抽卡”和“缝合”的循环,被上下文缺失和一致性抽卡所困。

这其中,既有模型能力的瓶颈,更有工具链生态的断裂。而可灵AI的新功能“灵动画布”,正是为了解决后者。

更关键的是,这是由大模型厂商亲自下场,为创作者打造的一站式工作台。

这也意味着,最懂模型的人,终于开始为我们打造顺手的工具了。

它用起来到底怎么样?我们也第一时间上手实测了一番。

1

从“想法”到“成品”,一个无缝的创作宇宙

当你的创作区不再是冰冷的菜单和窗口,而是一张可以无限缩放的画布。这,就是灵动画布的第一个惊喜——它让你所有的想法、素材、流程都一目了然,更接近我们大脑中创意迸发的非线性方式。

据官方介绍,画布的布局可以分为三个部分:中心的核心工作区为主体,你可以在此完成所有节点的创建、编排与预览。左侧的“我的资产库”为你提供历史素材的拖拽复用,而右方的“当前创作历史”则能够快速定位和回溯每一次的生成结果,让整个创作流程清晰可控。


现在,就让我们以一个具体的科幻短片为例,完整地走一遍这条全新的创作路径,看看它是如何将一个模糊的想法,打磨成一部作品雏形的。

我们的目标是:制作一个宇航员在异星沙漠行走的科幻短视频。

首先,是把这个想法“画”出来。我们不再需要打开文档写剧本和分镜,而是可以直接在画布中央的全局对话框里,用大白话输入这个核心创意。


接着,AI就会主动帮你“翻译”和“优化”prompt。

例如,我们只说了“宇航员”,它便在生成节点的prompt里自动补全为:“一位宇航员身穿白色太空服,头盔反射着遥远星系的微光,正独自一人行走在外星球的广袤沙漠中。脚下的沙丘呈现出奇异的橙红色,背景是高耸的、形状怪异的山脉,天空中悬挂着两个大小不一的月亮,营造出一种孤独而神秘的宇宙氛围。”


文本输入确定后,接下来,我们可以选择模型型号为最新的可图2.1版本,并将参数改成一次性生成4张高清图,确认生成。每个步骤也会有清晰的消耗明细,方便创作者控制成本。


在这个环节,节点式的设计,让用户基本可以告别“覆盖式开盲盒”的痛苦了。

举个例子,如果上图中的这四张生成结果,你都不满意,可以直接修改prompt,进行新一轮的生成,例如,我们想看看漫画风格或是多巴胺童话色彩风,重新生成后的新结果会出现在一个单独的分支,整整齐齐地排列着,而不是覆盖旧版,相比此前,大大方便了用户进行比对、挑选。


在这里,我们可以打开大图预览。当我们选中了第三次生成结果的第二张图后,鼠标悬置在图片上,就可以点击进行图生图、图生视频任务了,AI自动搭建好节点,且每一个节点都可以通过手动拉取、替换连接线,进行自由调整。

确定好图片,下一步,我们就可以继续输入自然语言,生成一个让宇航员边走边跳的视频了。

以下就是模型一次生成的效果,可以说是非常符合预期效果的了。

不过,和图片多轮生成一样,如果你想要修改动作,让AI再“保一条”,也很简单。

例如换成宇航员边走边摇摆跳舞的搞笑类短视频,你依然可以微调prompt,然后再次生成。


在这个过程中, 我们可以像导演在监视器前一样,直观地对比两个Take:A版本的构图更好,B版本的动作更流畅。我们最终选择了B版本,因为它更符合我们对动态的要求。

最后,当短片的雏形初具,我们意识到还需要音效来烘托气氛。在传统流程中,这意味着打包项目文件、上传、发链接,等待音效师制作、再回传……整个过程充满了沟通和版本管理的混乱,在这里我们只需要点击视频进入下一个配音环节,你就可以得到下面这个视频了。

这就是节点式无限画布带来的连续性和全局感。

如果你还想这个短片继续进行下去,只需要以其中一张作为参考图,继续生成下一镜的图片,选中合适分镜后,继续生成视频,循环这个操作,就让节点不断蔓延下去,让剧情不断进行下去。

对于复杂的故事短片创作而言,节点式创作依然是个大工程,于是,这块画布也为协作而生的——你只需分享一个链接,就能邀请整个团队加入。


协作模式下,不仅所有成员可以在同一个项目内同时进行创作,生成的结果共享,还可以看到其他人的光标位置,通过点击右上角的成员头像,可以快速定位到他的视图位置。

这对团队创作来说,意味着底层逻辑的彻底改变。过去,创作是一场线性的、充满等待和版本错乱的“接力赛”;现在,它变成了一场围绕同一块画布的“实时共创”。编剧、导演、视觉可以同时在线,创作不再是信息孤岛。

在清晰的可追溯的流程和自由可控的节点下, 从一个模糊的想法,到场景构建、镜头筛选、视觉衔接,再到团队协作,一部科幻短片的骨架,可以都在这个统一、直观的画布上一气呵成地搭建完成。

1

画布,而非对话:可灵选择了一条更“实在”的路

正如在WAIC的快手可灵生态论坛上,可灵AI视觉生成与互动中心负责人万鹏飞所说,可灵的技术迭代始终围绕两大主线:一是基础模型能力提升,二是与用户共创优化产品方向,形成“技术+用户”双轮驱动模式。

进入2025年,随着基础模型能力的提升,越来越多的人开始关注AI视频创作场景下难以工业化的痛点,越来越多的Agent也加入了AI视频创作的体验优化中。

但相比于Agent,可灵AI选择了偏向于工作流搭建的画布式形态。

这是因为,对于短片创作者而言,创作是一个多个环节的强时序的搭建过程。

通过上文的案例,我们可以看到在画布形态下,整个创作过程——那些零散的素材、不同的版本、镜头的衔接关系——像乐高积木一样摊开在你面前,让你能看清、能触摸、能随时调整。

它从根本上承认了:真正的创作,是需要我们把手放在方向盘上的。

对专业创作者而言,这种节点式的画布会让人第一时间想到类似形态的ComfyUI。


而对于不熟悉它的读者,可以将其理解为一套针对Stable Diffusion的、完全开源的图形用户界面。它在2023年初才真正进入大众视野,但凭借其极致的灵活性,在GitHub上迅速积累了超过8万颗星(Star),成为AI绘画领域一个现象级的存在。

过去两年,无数艺术家和创作者宁愿忍受它陡峭的学习曲线,就是因为它提供了最核心的东西:掌控力。它将Stable Diffusion的底层逻辑完全模块化、可视化,允许创作者像拼接电路一样,自由定义工作流的每一个细节——从加载模型、输入提示词,到控制采样器和各种插件。

但也正因如此,它极高的学习门槛也将无数普通用户拒之门外。搭建一个理想的工作流,往往需要大量的时间和专业知识。

而可灵AI的灵动画布,可以理解为,它把这种专业级的掌控力,用一种极其直观、友好的方式,交到了我们每一个人的手上。

当然,这一切能发生,也因为一个重要的前提:AI视频模型的基础能力达到了一定的水平,通过抽卡、图片参考,已经能够生产出具有一致性的下一帧了。

在模型的能力提升,正在不断补齐想象力的最后一块拼图的同时,灵动画布则为创作者递上了一支真正能将想象力编织成故事的笔。


点个爱心,再走 吧

免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。