“2025年将是生成式AI技术走向深度应用的关键元年”,在刚刚结束的世界人工智能大会上,快手高级副总裁、可灵AI负责人兼社区科学线负责人盖坤给出了这样的判断。他认为,生成式AI不仅仅是技术的革新,更是生产关系的重塑。 本次人工大会期间,可灵AI重磅发布了全新的多图参考、灵动画布等功能。其中,升级后的多图参考,在角色、主体和场景一致性、动态质量、画风保持等方面显著提升;灵动画布功能则在7月27日正式开启邀测。根据快手在大会上披露的信息显示,可灵AI目前已在全球拥有超过4500万创作者。
快手高级副总裁、可灵AI负责人兼社区科学线负责人盖坤为论坛致辞。
可灵AI视觉生成与互动中心负责人万鹏飞回顾了可灵AI发布以来的技术演进路径。他表示,可灵的技术迭代始终围绕两大主线:一是基础模型能力提升,二是与用户共创优化产品方向。可灵团队通过用户反馈持续优化模型,形成“技术+用户”双轮驱动模式。
万鹏飞表示,可灵1.0版本向全球证明视频生成技术可实际应用,2.0版本则通过性能与成本优化推动行业标准化。1.0的发布直接验证了类似Sora的视频生成技术从概念到落地的可能性,而2.0的推出进一步明确了新一代模型的技术范式,带动行业竞相跟进。未来,可灵将持续输出技术成果,助力企业降低创作门槛,探索数字人交互、游戏内容生成等新场景。
在论坛上,导演薛晓路分享了使用可灵AI进行影视创作的实践经验。她以短片《喵心归处》为例,指出可灵1.6版本已在动物生成、场景还原等方面展现出强大能力,随后可灵陆续推出的新模型能更好支持复杂动作生成,显著提升创作效率。她表示,AI重构了传统影视制作流程,从剧本到分镜、生成、剪辑均可在计算机快速完成,大幅降低时间与成本风险。
据悉,目前可灵AI已通过API为超过2万家企业客户提供服务,覆盖广告营销、影视动画、游戏制作等行业。
“2025年将是生成式AI技术走向深度应用的关键元年”,盖坤表示,随着去年6月可灵上线,整个行业都意识到视频生成大模型的技术拐点已至,其应用的成熟和发展速度也会非常迅猛。未来,技术趋势将聚焦于生成效果和可控性的持续突破,技术的精进也将为产业应用带来更多可能性。
采写:南都N视频记者 徐冰倩