![]()
智东西
作者 陈骏达
编辑 漠影
这一多模态AI创意工具,迎来多项重磅升级!
智东西11月6日报道,近日,昆仑万维旗下的多模态创意工具平台SkyReels迎来一波集中升级,其中最大的亮点就是,他们用一张“无限画布”,取代了复杂的创作交互方式。
在新版SkyReels上,无论是图片、视频生成还是数字人,每一种内容的生成、编辑与组合都可以在同一张“无限画布”上完成,并且通过简单拖拽即可实现多模态内容的自由创作。
![]()
这些新功能并非孤立存在,而是相互联动、形成层次分明的解决方案。SkyReels根据用户不同的工具使用能力,提供了三种创作路径:
熟悉AI工具的用户可以直接使用AI模型生成图片、视频、音频或数字人内容;希望更高效创作的用户,则可依托近30款聚焦特定场景的Expert Agent,快速完成生成;而对没有创作经验的小白用户,只需套用智能模板,通过简单的文字描述和画面替换,即可轻松复刻参考内容。
在此基础上,SkyReels还推出了Agentic Copilot模式——集Super Agent与Expert Agents于一体的“双核驱动”体系。用户可以通过自然语言、上传素材或提供链接,让AI理解并生成跨模态的创意内容。我们还用这一功能,复刻了Vlog之父Casey Neistat的拍摄风格。
无论是捕捉灵感瞬间,还是规划完整的创作流程,Agent都能提供智能辅助,让复杂的创作变得轻松、高效。
智东西对SkyReels近期的升级进行了全面体验。可以说,这一升级后的创作平台,不仅在功能上提供了便利,更在整体体验上实现了统一与流畅。无限画布、智能Agent等要素的结合,让用户能够在一个简洁直观的平台上,实现海量创意的可能。
一、一张无限画布,如何统一AI多模态创作?
如今的多模态AI创作平台看起来五花八门、功能强大,但用起来却常常让人头大。界面层层叠叠,操作逻辑又有点反直觉,更麻烦的是,不同功能之间(比如生图、生视频、生音频)等往往处在不同的界面,甚至是不同的网站,毫无连贯感。
例如,谷歌推出的AI视频创作工具Flow仅支持文本转视频、帧转视频和素材转视频,如果想用谷歌的Gemini 2.5 Flash生成图像,并用于创作,还需切换到谷歌的其他AI工具。
![]()
对创作者来说,这种割裂的体验打断了创作灵感,也拉高了AI工具的学习成本。AI本该让创作更轻松、更有趣,但现在的门槛反而挡住了许多好点子。
那么,一个真正以创作者为中心、能够打通多模态的AI创作平台,应该是什么样的?
SkyReels给出的答案,就是一张“无限画布”。
打开新版SkyReels,占据视觉中心的并非密集的功能面板,而是承载创作素材的画布。这让用户的注意力和操作重心始终在创作本身,而不是被复杂的菜单和参数所干扰。
![]()
所有AI功能与模型都被整合到画布的侧边栏,既有昆仑万维自家的多款模型,也覆盖了当前业内的几乎所有主流模型。在这片空间中,用户可以自由地上传图像、音频、视频等多模态内容,文生图生成的素材可以成为图像编辑、图生视频的起点。
这种设计符合用户长期形成的心智模型。Photoshop以画布为中心,工具和功能区被放在侧边栏或顶部菜单,用户直接在画布上操作图像、绘制、编辑。AE同样以画布为视觉核心,所有特效、素材、合成操作在画布上直观呈现,工具界面相对辅助。
在继承经典创作软件的界面逻辑、降低用户学习门槛的同时,SkyReels也对多模态创作流程进行了创新整合,让创作在图像、视频、音频之间自由流动。
在无限画布上,用户主要以三种方式进行交互与创作:拖拽、对话、二次编辑。
用户可以一次性上传多张图片、多个视频,并根据创作需求将素材拖拽到对应的功能上。
例如,将静态图片拖拽到“视频生成”功能上后,它便会在画布原地变为动态视频。

如果需要让视频中的人物说出想要的台词,就只需拖动这个视频到“Avatar(数字人)”功能上,人物就能开口说话。

同时,用户还能在无限画布上捕捉并打磨灵感。当听到令人心动的音乐、看到有启发性的视频后,只需将音频拖入Chat界面,与智能agent对话。Agent能帮助用户逐步厘清创作需求,并最终生成相应的视觉画面。
![]()
在获得初步生成结果后,用户可以进行二次编辑——包括视频风格化、延长内容或进行UpScale画质升级等。这些操作都可在同一界面中完成,无需跳转或切换。
SkyReels的无限画布,把复杂的操作和设置都封装在了简单的物理动作背后。“我们希望用户不需要学习AI,而只需要使用AI。”SkyReels团队这样强调。
二、Agent深度融入创作,海量模板让数字营销更轻松
为了让创作的流程进一步提效与智能化,SkyReels 还引入了“双核驱动”的智能创作体系——由Super Agent与Expert Agents共同构成的全能与专业一体化系统。
在内容创作的早期阶段,灵感往往稍纵即逝,图片、文字、视频都有可能成为创作的起点。Super Agent的设计让捕捉这种瞬间的创意需求变得更为容易。
在试用中,Super Agent的多模态识别能力表现出色:无论是上传图片、输入文字,还是提供视频,它都能跨模态快速理解意图,并给出有针对性的反馈。
知名Vlogger Casey Neistat有“Vlog之父”称号,其风格启发了不少创作者。如今,借助Super Agent的能力,普通人也能在SkyReels中复刻Neistat的风格。
我们可以上传Neistat的Vlog,并输入指令“按照Casey Neistat的风格帮我打造一只关于小狗的Vlog”。Super Agent系统能根据视频的内容,并结合公开信息,分析提炼创作风格。
当用户的指令并不清晰时,Super Agent不会将错就错,而是会主动提问,让用户输入所需信息,或是选择创作方向。
![]()
完全了解用户需求后,Super Agent才会开始规划创作流程,帮用户逐步打造制作计划、分镜、生成角色与背景和生成视频,期间,用户不用手动切换工具,只需要确认Agent提出的方案或动作,仅在不满意时才需介入调整。
![]()
SkyReels生成的首个镜头如下,无论是清晨的纽约城,还是富有动感的运镜,都和Neistat的风格有几分神似。在此基础上,用户可以继续按照计划生成视频,最终获取足够的创作素材。
更值得一提的是,Super Agent并非单次响应的“问答式工具”,而是一个可以被随时唤起、持续陪伴的创作伙伴,可以参与到用户创作的每一个阶段。
相比Super Agent的通用创意能力,Expert Agents更像是一个针对垂直行业打造的“专业智囊库”。目前SkyReels已内置28个专家Expert Agents,覆盖市场营销、电商运营、虚拟形象打造和故事创作等领域。
![]()
在我们的体验中,营销类Expert Agent尤其值得关注。要使用Expert Agents,用户本身并不需要是特定领域的“专家”——Expert Agents在每个场景都会给出清晰的指引,用户按照指引,像做填空题一样补全产品卖点、目标受众、所传递的情绪、使用场景等关键信息后,系统便能生成完整的营销素材,如海报、宣传视频等等。
![]()
▲SkyReels帮助用户厘清消费电子产品的宣传视频拍摄策略
这28个专家Agent均在特定领域经过深度训练和优化。它们内置了该领域的专业知识库和成熟的工作流程,能够理解行业术语和复杂需求,提供具有行业洞察、可执行性强的专业方案。这使非专业用户也能快速获得具备可执行性的成品方案,而不必陷入反复调整和试错。
随着多Agent的协作机制进一步完善,未来,这些Agent或许将有望组成专业团队,协作完成更为复杂的任务。
同时,为进一步便利创作,SkyReels还配备了海量创作模板。这些模板同样主打“简单好用”,甚至连文字提示词都无需输入——用户只需上传基本的图像素材,即可完成替换。
![]()
例如,在服装外贸电商场景,SkyReels的模板已经覆盖了不同人种、不同肤色、不同服装类目,无论是T恤衫、卫衣、夹克还是大衣,都有对应的细分模板。
![]()
替换元素后,新的卫衣款式、品牌Logo能与原模板无缝融合,真正实现了模板效果的“所见即所得”。
智东西批量尝试了多个不同样式的模板,其融合效果始终稳定可靠,几乎没有割裂感和不自然的观感。
此类数字营销工具,让相关从业者无需耗费大量时间、精力拍摄宣传素材,也减少了他们学习AI工具的机会成本。从业者可以把精力集中于产品创意与市场策略本身,从而更高效地实现品牌传播与业务增长目标。
三、底层模型能力集中升级,数字人能实现多人对话了
“无限画布”、Agent、模板等创作方式的升级背后,是昆仑万维在视频生成模型底层能力上的不断突破。
数字人能力方面,SkyReels V3模型首先在生成长度上实现跨越,能完成数分钟的数字人画面生成。借助这一功能,我们甚至可以用自己打造的卡通形象,拍一部新品宣传广告片。
SkyReels在生成数字人时,支持32个运镜组合与镜头运动选项,能够满足不同叙事和画面表达需求,使视觉表现更加生动自然。这些特性,让数字人能胜任更为完整的营销叙事,提升宣传效果。
![]()
SkyReels V3还是业内首个支持单镜头多人多轮对话的数字人模型。在传统的数字人生成模型更多仅提供单人对口型和多人同时发声。SkyReels V3则能精准控制每个角色的说话时机、节奏、肢体语言和角色间的眼神互动,实现自然的多人对话流,甚至还能同步生成真实的环境音。
在创意场景,SkyReels现在还能将视频的创意延展,或是转变为特定的风格。
这些能力基于升级的SkyReels V3。其视频延长不再局限于业内“单镜头拉长”的传统方式,而是基于视频语义和用户prompt,智能预测下一个镜头的合理延续与场景内容。
SkyReels V3视频延长支持多种切镜方式,包括影视拍摄中常用的切入镜头、切出镜头、反打镜头、多角度镜头、切离镜头等,能生成具备叙事逻辑与视觉连贯性的延展片段,让镜头语言更丰富,画面更具动感与电影感。
这一能力让用户可以从短视频中自然过渡至更完整的叙事结构,为影视预演、电商视频延展、UGC 创作等场景提供更高效的生成方式。
而SkyReels V3此次的风格化模型并非简单的“滤镜迁移”。它通过对视频时序一致性、细节保真度与光影逻辑的深度优化,实现了1:1的角色、动作和场景保真。
无论是“辛普森风”、“乐高风”还是“梵高风”,视频中的细节都能保持一致,让风格化不再只是“涂层”,而是深度地融合到画面之中。
与市面上常见的5秒级别LoRA一键风格化不同,SkyReels的模型保持了原视频的动态结构与语义逻辑。这让风格迁移具备了更强的稳定性和一致性,足以支撑时长更长广告创意、动画预演的视觉再创作。
结语:SkyReels升级背后,昆仑万维的AI全景布局
SkyReels近期的升级,只是昆仑万维在AI领域的部分探索。昆仑万维近期披露的财报显示,其AI布局已经涵盖大模型、AGI研究、多模态创作平台、智能音乐与语音、游戏与社交等方向,并开源了Skywork-Reward、Skywork-R1V、UniPic、Matrix-3D 等系列模型,推出了SkyReels、Mureka、linky、StarMaker和DramaWave等多款应用。
这也带动了其业绩的快速增长。昆仑万维在本财年前三季度的营收已达58亿元,同比增长 52%,海外收入占比93%。作为中国AI出海的重要力量之一,昆仑万维有望持续推动AI技术研发、产品迭代和商业化应用,打造覆盖研发、创作和内容生态的全方位AI平台。





京公网安备 11011402013531号