“2025年春节DS(DeepSeek)让所有人用上了AI,2026年春节SD(SeeDance)让视频生成模型火遍全网”,最近一句流行语道出了视频生成模型SeeDance 的走红。2月14日,火山引擎正式发布豆包大模型2.0,在此之前,豆包视频生成模型Seedance 2.0、豆包图像创作模型Seedream 5.0 Lite已分别开启内测。此次三大模型共同完成版本升级,在多模态Agent、AI图像生成、AI视频生成等方面实现功能更新。北京青年报记者第一时间对三大模型进行实测,直观感受其在视频图像创意创作与日常办公等不同场景下的能力提升与使用便捷性。
![]()
实测:模糊指令也能一键出片
北青报记者首先对Seedream 5.0 Lite图像创作模型进行测评,通过输入“生成一张冬日滑雪的热点资讯海报,加些卡通元素”的简单指令,没有任何专业的指令描述,模型很快就生成了海报。海报以淡蓝色雪景为背景,雪人、滑雪儿童等卡通形象与文字标题搭配协调,还自动加入了当下流行的热门雪场top3,并附带“滑雪安全贴士”,列出滑雪相关注意事项。图片的清晰度也很高,可直接用在自媒体内容中,无需重复修改。
首批体验该模型的AI创作者谯华表示,这个模型能联网寻找最新的资讯,做热点海报特别方便,而且能直接生成2K高清的图片,细节和光影都很自然,日常做配图、简单的商用海报完全够用,现在剪映、即梦AI这些常用的平台都能直接使用,免费次数多,呈现够用、好用、免费的优势特点,性价比很高。
北青报记者经过测试也发现,不管是做学科板报、产品宣传图还是创意涂鸦,模型生成的内容都能贴合需求,人物和场景的一致性很高,基本不会出现画面混乱的情况。
而Seedance 2.0视频生成模型,也能让没有专业基础的普通用户快速生成效果更稳定、更贴近创作意图的视频内容。北青报记者上传了一张温馨的亲子写实图,配上“妈妈和宝宝面对面说悄悄话,镜头缓慢推近”的文字描述,又添加了一段轻柔的纯音乐,等待一段时间就生成了10秒的9:16竖屏视频。视频里人物的动作非常流畅自然,妈妈凑到宝宝耳边的表情温柔动人,镜头推进的节奏和描述基本契合,背景音乐和画面的衔接也很流畅,人物特征全程稳定,没有出现画面违和、形象变形的情况,基本不用任何后期处理,直接就能使用。
北青报记者在测试中能够感受到,不管是指定简单的人物动作,还是要求特定的镜头运镜,模型大致都能按照规定执行,生成的视频人物运动轨迹符合现实物理规律,物体交互也很真实,比如视频里宝宝抬手的小动作,自然又贴合实际,很少像以往那样反复生成、调试,大大节省了时间,就算是不懂视频制作的人,也能轻松做出效果不错的短视频。
![]()
延展:升级后的豆包办公处理更高效
作为此次升级的重点,豆包大模型2.0在多模态理解和任务处理上的表现让人眼前一亮。北青报记者试着上传了一份混有复杂表格、产品图片和5分钟长视频的工作资料,要求提取核心信息并整理成数据分析报告。一段时间后,模型生成的分析报告不仅能够提取表格里的关键数据、看懂了图片中的产品信息,还把长视频里的核心内容总结到位,生成的报告条理清晰、格式规范,生成的图表也十分准确明晰,仅需少量修改就能直接运用到日常工作中。
在使用过程中,北青报记者能够明显感受到,升级后的豆包大模型2.0,在处理多类型、复杂长程任务时效率更高,多模态理解能力更强,不管是看图文、读数据还是理解视频,都能快速抓准核心,适配日常办公的各类需求。
此外,在实际测试发布多轮指令时,北青报记者先让模型整理一份市场调研方案的框架,再让它在框架里补充具体的调研内容和执行步骤,模型能基本记住之前的要求,严格按照原有框架补充内容,很少出现答非所问的情况,输出的内容格式统一,贴合办公使用习惯。
分析:多模态AI领域优势明显
此次三大模型的迭代升级,经北青报记者实测发现,文字、图像、视频创作能力可以更连贯地配合使用,用户在一站式内容创作中体验更顺畅。据字节官方介绍,此次迭代升级中豆包大模型2.0作为“核心大脑”,为图像和视频创作模型提供底层的理解和推理能力,而Seedream 5.0 Lite和Seedance 2.0则让AI能力从企业办公延伸到了创意创作,覆盖了普通人的日常创作和企业的工作需求。
新加坡南洋理工大学计算机学院助理教授刘子纬表示,这次升级让字节跳动在多模态AI领域的优势更加明显,尤其是Seedance 2.0,在视频的画质和动态一致性上表现突出,还首次实现了多镜头叙事生成,把AI视频的制作水平推到了短视频的专业高度。而从实际应用来看,目前Seedream 5.0 Lite和Seedance 2.0已经接入了豆包、即梦等多个平台,普通用户不用下载专门的软件,在常用的平台上就能体验,豆包大模型2.0也将通过火山方舟体验中心开放使用。
数据显示,豆包大模型日均调用量已超过63万亿tokens,位居中国第一、全球前三。从实际体验的场景来看,无论是普通用户的日常创意创作,还是企业的数字化办公,都能在此次迭代升级中找到对应的AI应用方案,普通用户也能直接使用到多模态AI技术,切实感受到智能工具带来的便捷。
文/北京青年报记者 温婧
编辑/张丽





京公网安备 11011402013531号