![]()
Seedance和可灵还睡得着吗?
AIX财经(AIXcaijing)原创
作者 | 陈丹
编辑 | 魏佳
一匹匿名黑马,成为了AI视频圈最热的话题。
近日,Artificial Analysis的视频竞技场排行榜更新。一个从未出现过的名字——HappyHorse-1.0,同时出现在四个子榜单的前两位:截至4月9日中午,文生视频(无音频)赛道Elo1378分,领先第二名Seedance2.0整整105分;图生视频(无音频)赛道Elo1411分,刷新全平台历史最高纪录。在带音频的赛道上,它以1分和2分的微弱优势与Seedance 2.0并驾齐驱。
![]()
图源 / Artificial Analysis
没有发布会,没有任何公司背书,这匹黑马在短时间内完成了从零到双榜第一的跨越,将此前稳坐榜首数月的字节跳动Seedance2.0拉下了王座。在它的模型名称旁边,只有四个字:“即将推出”。这匹马,还没有真正跑起来。
这匹“快乐马”究竟是什么来头?它的第一有多少含金量?更重要的是,它会对行业带来什么?
01.
HappyHorse的第一,含金量如何?
要理解HappyHorse的真实水平,需先拆解它在Artificial Analysis(以下简称“AA”)不同榜单上的得分情况。
AA视频竞技场设四大核心赛道:文生视频(无音频)、图生视频(无音频)、文生视频(带音频)、图生视频(带音频)。截至4月9日的最新数据,在纯画质维度,HappyHorse已经建立统治地位;但一旦进入音画融合,它的领先优势并没有那么明显。
在文生视频(无声)赛道,HappyHorse斩获1378分,领先第二名字节跳动Seedance2.0 105 分。在Elo体系中,超过百分的差距意味着用户在盲测中几乎呈现“一边倒”的偏好。而在图生视频(无声)赛道,它跑出的1411分更是刷新了平台历史记录。对于追求极致运镜与画面质感的创作者而言,这匹马目前就是行业天花板。
然而,一旦加入音频维度,战局瞬间反转。HappyHorse与Seedance2.0的分差收缩至1-2分,几乎可以忽略不计。这也说明,在音画同步、音频质量及语义对齐层面,HappyHorse并未实现大幅超越,双方仍处于同一技术水平线。
结合社交媒体上的技术拆解与用户反馈,HappyHorse的优势大致可以归结为两个方向。
其一是架构层面的统一建模路径:多个信源指出,它采用约150亿参数规模的纯自注意力单流Transformer,将文本、视频与音频token放入同一序列进行联合建模,这种方式区别于常见的“视频生成+音频后处理”的拼接方案,使声音与画面在生成之初就处于同一语义空间,从而在口播与人物场景中呈现出更自然的同步效果。
其二是对人像场景的针对性优化:根据公开信息,多位参与AA盲测的用户反馈,其人物面部纹理更加细腻、镜头切换更为流畅,在复杂提示词下的人物一致性表现也更稳定,一位用户在连续对比Pyramid-Flow、Veo 3.1 Lite与PixVerse V6后甚至表示“只要出现HappyHorse基本都会选它”。
而这一主观体验恰好与Elo高分形成呼应。在AA的评测样本中,人像与口播类内容占比超过60%,使得这一局部优势被持续放大,并最终体现在整体排名上。
但高分并不意味着全能,社交媒体上的批评声同样不少。
不少用户指出,已经发布的视频中水体抖动细节不自然、快速运动中的条纹物体崩坏以及在大屏显示下的画质劣化等问题。这些缺陷在无音频赛道的高分掩盖下往往被忽略,但在影视级应用中却是致命伤。一位AIGC导演告诉「AIX财经」,从流出的片段看,它的感官很接近Seedance2.0,真实度不错,但剧烈运动时的“AI感”依然浓重。
X用户daniel.dmai更是直言不讳:“别把排名太当回事。当HappyHorse碰到的都是些旧模型时,大家自然会选那个看起来更顺眼的。它跟 Seedance2.0比还差得远。”
![]()
这种分歧,正好指向Elo盲测机制的优势与局限。
在AA评测中,用户先提交提示词或参考图像,系统调用两个模型生成结果并进行匿名展示,用户在不知模型来源的情况下进行选择,所有投票被纳入类似国际象棋排名的Elo系统,根据胜负关系动态调整分数,从而得到最终排名。
作为AI视频领域最具公信力的评测体系之一,Artificial Analysis的权威性正是来自于这套能够捕捉用户真实偏好的游戏规则。HappyHorse的高分是超过9000次真实用户盲选结果,比任何实验室跑出来的技术指标都更接近真实用户感受。
但其局限同样明确。首先,样本分布并非均衡,人像与口播类内容占比过高,使得在该场景中表现突出的模型更容易获得高分。另外,“刷榜”风险同样存在。有研究指出,Elo评分系统在特定情况下,可能通过数学变换掩盖底层数据的不确定性,从而影响评分。
因此,榜单高分不等于实际应用中的完美表现。在实际项目中,高分辨率下细节的稳定性、长时间视频的连贯性等,都是榜单盲测难以覆盖的。
更需要强调的是,目前除了官方榜单与有限的外部样本外,HappyHorse尚未经过充分的第三方使用与验证。这匹“匿名快马”的真实速度与能力,需等模型真正披露后才会揭晓。
02.
这匹马来自哪里?
随着HappyHorse霸榜,寻找这匹马的“主人”成了本周AI圈最热闹的猜谜游戏。
目前流传最广的线索,主要来自两个方向。
第一条线索来自技术侧的逐项对比。
有开发者将HappyHorse在榜单中的公开基准表现,与已知模型逐项对比,试图通过“能力特征”反推其来源。X用户Vigo Zhao的比对结果指向一个高度重合的对象——daVinci-MagiHuman。视觉质量4.80、文本对齐4.18、物理一致性4.52、语音字错率14.60%,四项核心指标几乎一一对应。与此同时,两者在官网架构描述、演示视频风格上的相似性,也让这一猜测进一步增强。
![]()
公开信息显示,daVinci-MagiHuman由上海创智学院(SII)生成式人工智能研究实验室(GAIR)与AI初创公司Sand.ai联合研发,已于今年3月在GitHub开源。如果这一链条成立,那么HappyHorse并非“横空出世”,而是一次技术复用。
相比于技术比对,第二条线索更具戏剧性,它指向了一个名字——张迪。
多个信源将HappyHorse与张迪联系在一起。公开信息显示,张迪在2010年毕业于上海交大后加入阿里,在阿里妈妈体系内长期负责大数据与机器学习架构。2020年,他转投快手,担任技术副总裁,主导搭建可灵大模型体系,并推出可灵1.0 / 2.0视频生成模型,被业内称为“可灵之父”。2025年短暂加入B站后,又在同年回归阿里,出任淘天集团未来生活实验室负责人。
如果传闻属实,时间线在这里变得耐人寻味。张迪回归阿里约5个月后,HappyHorse登顶,这意味着一支刚刚重组的团队,在半年内就用一款更轻量、更高效的模型实现了对行业头部的“反杀”。这是技术能力的体现,也意味着人才流动正在重新塑造竞争格局。
「AIX财经」向阿里相关人员求证,对方回复“这个事情我们不太了解”。但资本市场已先行一步。消息发酵当天,阿里巴巴港股一度上涨超过 7%。
不过,无论最终身份指向Sand.ai、阿里,还是其他团队,HappyHorse的出场方式本身,或许比“它是谁”更重要。
从命名到发布路径,它都带有明显的“设计痕迹”。2026年是农历马年,“HappyHorse”本身藏着马年梗;官方支持语言中将普通话与粤语并列,也进一步强化了其出自亚洲团队的可能性。更关键的是,它选择的不是发布会,而是榜单,不是讲故事,而是直接给结果。
这一策略并非孤例。今年2月,神秘模型Pony Alpha在OpenRouter平台上线时,同样没有任何背景信息,却迅速引发行业“猜爹”,最终被证实为智谱AI的GLM-5。路径几乎完全一致:匿名上线-榜单出圈-身份揭晓。
先盲测,再发布——正在成为一种可复制的行业打法。
把模型丢进第三方评测平台,剥离品牌溢价,只拼性价比,让用户用鼠标投票。如果跑出好成绩,自然引发行业关注和媒体报道。
这种策略特别适合资源有限但技术尖端的亚洲团队。不用砸钱做营销,只需要一个足够好的模型和一个足够公信的评测平台。HappyHorse的参数规模约150亿,并不算当前视频模型中的“巨无霸”,Seedance2.0的体量普遍被认为更大,但它通过架构设计与评测场景的精准匹配,实现了“以小博大”的效果。
但这种策略也有短板。
匿名发布,本质上是一种“预期管理套利”。当用户不知道模型来自哪里时,评价标准被压缩到最单一的维度——好不好用。一旦身份揭晓、产品开放,用户的判断会迅速叠加品牌、稳定性、成本与可控性等因素,预期也会随之抬升。如果实际体验无法支撑这种预期,热度往往会迅速回落。
Pony Alpha在身份确认后的关注度明显低于匿名阶段,正是一个典型例子。因此,与其说HappyHorse的悬念在于“它是谁”,不如说在于当这匹马真正亮相之后,它还能不能跑出现在这样的速度。
03.
“快乐马”让谁不快乐?
如果把时间线拉长,AI视频赛道正处于一场剧烈的重构之中。
2026年初,字节跳动的Seedance2.0爆火出圈,接过了“行业标杆”的接力棒。而曾经的领跑者OpenAI却在3月突然按下停止键——Sora全面关停。这款曾被视为“视频生成GPT时刻”的产品,最终倒在了经济账面前:日均1500万美元的推理成本,对比生命周期内仅约210万美元的总收入,这种严重的“成本-收益”倒挂,让先行者最终成了先烈。
Sora退场留下的真空,迅速被字节与快手填补。Seedance2.0承接了技术天花板的预期;可灵则以超6000万用户和正向毛利率的商业化实绩,稳扎稳打地推进变现。两者共同点很明显,均为闭源模型,均在积极商业化,均在用真金白银验证AI视频的商业模式是否成立。
直到HappyHorse突然出现。它带来的冲击,不只是性能上“更强一点”。
对于开发者而言,HappyHorse的开源基因意味着游戏规则的重写。一旦模型权重与推理代码全量披露,用户可以绕过高昂的API付费体系,转向自部署与深度定制。它挑战的就不再是某一款产品,而是整个闭源商业模式的底层逻辑。
换句话说,它动的是规则,而不仅仅是排名。
150亿的参数规模,意味着相对更低的推理门槛。一旦支持私有化部署,对于高频使用视频生成的工作室和营销团队而言,边际成本将随使用量增加而持续摊薄。
虽然HappyHorse尚未公测亦未公布定价,但业内已出现强烈预期,不少讨论认为其费用或仅为Seedance的一半。这种价格预期背后,折射出专业创作群体对现有闭源模型高成本压力的集体焦虑。
当然,这一切的前提是——开源真正落地。
除了开源之外,对于HappyHorse而言,真正问题在于上线后能不能赢下市场。
即梦与可灵的壁垒,除了技术本身,还有与业务场景的深度融合。在电商直播、广告投放、内容分发等场景中,视频生成能力只是插件,流量分配权与业务流闭环才是真正的护城河。HappyHorse可以赢在盲测的第一眼惊艳里,但要进入真实生产流,还有更长的路要走。
与此同时,更残酷的现实是,技术领先的“保质期”正在急剧缩短。
从去年9月至今,可灵2.5Turbo、Seedance2.0、SkyReelsV4等模型轮流登顶,几乎每月一次“新王登基”。好耶科技创始人吴杰茜曾对「AIX财经」表示,视频大模型的竞争是一场永不停歇的烧钱长跑。一旦投入强度稍有松懈,或迭代速度慢于对手,用户会毫不犹豫地倒向更新、更强的模型。“赢家通吃”的法则,迫使厂商持续加码,稍有松懈即被淘汰。
HappyHorse的出现,短期内让享受Sora退场红利的头部厂商感受到了切实压力。长期来看,它向整个行业抛出了一组更本质的拷问:开源与闭源,哪种路径能跑通长效盈利?在迭代周期以月为单位的赛道里,真正的护城河究竟是模型本身,还是那张看不见的商业分发网络?
Sora的失败证明了一件事,技术领先不能替代商业闭环。而HappyHorse的出现提醒了另一件事:在开源浪潮面前,闭源模型的定价权与壁垒,或许比想象中更加脆弱。





京公网安备 11011402013531号