当前位置：首页 » 资讯 » 新科技 » 正文

匿名霸榜、阿里“不认”，HappyHorse是谁？

IP属地中国·北京 AIX财经 时间：2026-04-09 23:59:14

Seedance和可灵还睡得着吗？
AIX财经（AIXcaijing）原创
作者 | 陈丹
编辑 | 魏佳
一匹匿名黑马，成为了AI视频圈最热的话题。
近日，Artificial Analysis的视频竞技场排行榜更新。一个从未出现过的名字——HappyHorse-1.0，同时出现在四个子榜单的前两位：截至4月9日中午，文生视频（无音频）赛道Elo1378分，领先第二名Seedance2.0整整105分；图生视频（无音频）赛道Elo1411分，刷新全平台历史最高纪录。在带音频的赛道上，它以1分和2分的微弱优势与Seedance 2.0并驾齐驱。

图源 / Artificial Analysis
没有发布会，没有任何公司背书，这匹黑马在短时间内完成了从零到双榜第一的跨越，将此前稳坐榜首数月的字节跳动Seedance2.0拉下了王座。在它的模型名称旁边，只有四个字：“即将推出”。这匹马，还没有真正跑起来。
这匹“快乐马”究竟是什么来头？它的第一有多少含金量？更重要的是，它会对行业带来什么？
01.
HappyHorse的第一，含金量如何？
要理解HappyHorse的真实水平，需先拆解它在Artificial Analysis（以下简称“AA”）不同榜单上的得分情况。
AA视频竞技场设四大核心赛道：文生视频（无音频）、图生视频（无音频）、文生视频（带音频）、图生视频（带音频）。截至4月9日的最新数据，在纯画质维度，HappyHorse已经建立统治地位；但一旦进入音画融合，它的领先优势并没有那么明显。
在文生视频（无声）赛道，HappyHorse斩获1378分，领先第二名字节跳动Seedance2.0 105 分。在Elo体系中，超过百分的差距意味着用户在盲测中几乎呈现“一边倒”的偏好。而在图生视频（无声）赛道，它跑出的1411分更是刷新了平台历史记录。对于追求极致运镜与画面质感的创作者而言，这匹马目前就是行业天花板。
然而，一旦加入音频维度，战局瞬间反转。HappyHorse与Seedance2.0的分差收缩至1-2分，几乎可以忽略不计。这也说明，在音画同步、音频质量及语义对齐层面，HappyHorse并未实现大幅超越，双方仍处于同一技术水平线。
结合社交媒体上的技术拆解与用户反馈，HappyHorse的优势大致可以归结为两个方向。
其一是架构层面的统一建模路径：多个信源指出，它采用约150亿参数规模的纯自注意力单流Transformer，将文本、视频与音频token放入同一序列进行联合建模，这种方式区别于常见的“视频生成+音频后处理”的拼接方案，使声音与画面在生成之初就处于同一语义空间，从而在口播与人物场景中呈现出更自然的同步效果。
其二是对人像场景的针对性优化：根据公开信息，多位参与AA盲测的用户反馈，其人物面部纹理更加细腻、镜头切换更为流畅，在复杂提示词下的人物一致性表现也更稳定，一位用户在连续对比Pyramid-Flow、Veo 3.1 Lite与PixVerse V6后甚至表示“只要出现HappyHorse基本都会选它”。
而这一主观体验恰好与Elo高分形成呼应。在AA的评测样本中，人像与口播类内容占比超过60%，使得这一局部优势被持续放大，并最终体现在整体排名上。
但高分并不意味着全能，社交媒体上的批评声同样不少。
不少用户指出，已经发布的视频中水体抖动细节不自然、快速运动中的条纹物体崩坏以及在大屏显示下的画质劣化等问题。这些缺陷在无音频赛道的高分掩盖下往往被忽略，但在影视级应用中却是致命伤。一位AIGC导演告诉「AIX财经」，从流出的片段看，它的感官很接近Seedance2.0，真实度不错，但剧烈运动时的“AI感”依然浓重。
X用户daniel.dmai更是直言不讳：“别把排名太当回事。当HappyHorse碰到的都是些旧模型时，大家自然会选那个看起来更顺眼的。它跟 Seedance2.0比还差得远。”

这种分歧，正好指向Elo盲测机制的优势与局限。
在AA评测中，用户先提交提示词或参考图像，系统调用两个模型生成结果并进行匿名展示，用户在不知模型来源的情况下进行选择，所有投票被纳入类似国际象棋排名的Elo系统，根据胜负关系动态调整分数，从而得到最终排名。
作为AI视频领域最具公信力的评测体系之一，Artificial Analysis的权威性正是来自于这套能够捕捉用户真实偏好的游戏规则。HappyHorse的高分是超过9000次真实用户盲选结果，比任何实验室跑出来的技术指标都更接近真实用户感受。
但其局限同样明确。首先，样本分布并非均衡，人像与口播类内容占比过高，使得在该场景中表现突出的模型更容易获得高分。另外，“刷榜”风险同样存在。有研究指出，Elo评分系统在特定情况下，可能通过数学变换掩盖底层数据的不确定性，从而影响评分。
因此，榜单高分不等于实际应用中的完美表现。在实际项目中，高分辨率下细节的稳定性、长时间视频的连贯性等，都是榜单盲测难以覆盖的。
更需要强调的是，目前除了官方榜单与有限的外部样本外，HappyHorse尚未经过充分的第三方使用与验证。这匹“匿名快马”的真实速度与能力，需等模型真正披露后才会揭晓。
02.
这匹马来自哪里？
随着HappyHorse霸榜，寻找这匹马的“主人”成了本周AI圈最热闹的猜谜游戏。
目前流传最广的线索，主要来自两个方向。
第一条线索来自技术侧的逐项对比。
有开发者将HappyHorse在榜单中的公开基准表现，与已知模型逐项对比，试图通过“能力特征”反推其来源。X用户Vigo Zhao的比对结果指向一个高度重合的对象——daVinci-MagiHuman。视觉质量4.80、文本对齐4.18、物理一致性4.52、语音字错率14.60%，四项核心指标几乎一一对应。与此同时，两者在官网架构描述、演示视频风格上的相似性，也让这一猜测进一步增强。

公开信息显示，daVinci-MagiHuman由上海创智学院（SII）生成式人工智能研究实验室（GAIR）与AI初创公司Sand.ai联合研发，已于今年3月在GitHub开源。如果这一链条成立，那么HappyHorse并非“横空出世”，而是一次技术复用。
相比于技术比对，第二条线索更具戏剧性，它指向了一个名字——张迪。
多个信源将HappyHorse与张迪联系在一起。公开信息显示，张迪在2010年毕业于上海交大后加入阿里，在阿里妈妈体系内长期负责大数据与机器学习架构。2020年，他转投快手，担任技术副总裁，主导搭建可灵大模型体系，并推出可灵1.0 / 2.0视频生成模型，被业内称为“可灵之父”。2025年短暂加入B站后，又在同年回归阿里，出任淘天集团未来生活实验室负责人。
如果传闻属实，时间线在这里变得耐人寻味。张迪回归阿里约5个月后，HappyHorse登顶，这意味着一支刚刚重组的团队，在半年内就用一款更轻量、更高效的模型实现了对行业头部的“反杀”。这是技术能力的体现，也意味着人才流动正在重新塑造竞争格局。
「AIX财经」向阿里相关人员求证，对方回复“这个事情我们不太了解”。但资本市场已先行一步。消息发酵当天，阿里巴巴港股一度上涨超过 7%。
不过，无论最终身份指向Sand.ai、阿里，还是其他团队，HappyHorse的出场方式本身，或许比“它是谁”更重要。
从命名到发布路径，它都带有明显的“设计痕迹”。2026年是农历马年，“HappyHorse”本身藏着马年梗；官方支持语言中将普通话与粤语并列，也进一步强化了其出自亚洲团队的可能性。更关键的是，它选择的不是发布会，而是榜单，不是讲故事，而是直接给结果。
这一策略并非孤例。今年2月，神秘模型Pony Alpha在OpenRouter平台上线时，同样没有任何背景信息，却迅速引发行业“猜爹”，最终被证实为智谱AI的GLM-5。路径几乎完全一致：匿名上线-榜单出圈-身份揭晓。
先盲测，再发布——正在成为一种可复制的行业打法。
把模型丢进第三方评测平台，剥离品牌溢价，只拼性价比，让用户用鼠标投票。如果跑出好成绩，自然引发行业关注和媒体报道。
这种策略特别适合资源有限但技术尖端的亚洲团队。不用砸钱做营销，只需要一个足够好的模型和一个足够公信的评测平台。HappyHorse的参数规模约150亿，并不算当前视频模型中的“巨无霸”，Seedance2.0的体量普遍被认为更大，但它通过架构设计与评测场景的精准匹配，实现了“以小博大”的效果。
但这种策略也有短板。
匿名发布，本质上是一种“预期管理套利”。当用户不知道模型来自哪里时，评价标准被压缩到最单一的维度——好不好用。一旦身份揭晓、产品开放，用户的判断会迅速叠加品牌、稳定性、成本与可控性等因素，预期也会随之抬升。如果实际体验无法支撑这种预期，热度往往会迅速回落。
Pony Alpha在身份确认后的关注度明显低于匿名阶段，正是一个典型例子。因此，与其说HappyHorse的悬念在于“它是谁”，不如说在于当这匹马真正亮相之后，它还能不能跑出现在这样的速度。
03.
“快乐马”让谁不快乐？
如果把时间线拉长，AI视频赛道正处于一场剧烈的重构之中。
2026年初，字节跳动的Seedance2.0爆火出圈，接过了“行业标杆”的接力棒。而曾经的领跑者OpenAI却在3月突然按下停止键——Sora全面关停。这款曾被视为“视频生成GPT时刻”的产品，最终倒在了经济账面前：日均1500万美元的推理成本，对比生命周期内仅约210万美元的总收入，这种严重的“成本-收益”倒挂，让先行者最终成了先烈。
Sora退场留下的真空，迅速被字节与快手填补。Seedance2.0承接了技术天花板的预期；可灵则以超6000万用户和正向毛利率的商业化实绩，稳扎稳打地推进变现。两者共同点很明显，均为闭源模型，均在积极商业化，均在用真金白银验证AI视频的商业模式是否成立。
直到HappyHorse突然出现。它带来的冲击，不只是性能上“更强一点”。
对于开发者而言，HappyHorse的开源基因意味着游戏规则的重写。一旦模型权重与推理代码全量披露，用户可以绕过高昂的API付费体系，转向自部署与深度定制。它挑战的就不再是某一款产品，而是整个闭源商业模式的底层逻辑。
换句话说，它动的是规则，而不仅仅是排名。
150亿的参数规模，意味着相对更低的推理门槛。一旦支持私有化部署，对于高频使用视频生成的工作室和营销团队而言，边际成本将随使用量增加而持续摊薄。
虽然HappyHorse尚未公测亦未公布定价，但业内已出现强烈预期，不少讨论认为其费用或仅为Seedance的一半。这种价格预期背后，折射出专业创作群体对现有闭源模型高成本压力的集体焦虑。
当然，这一切的前提是——开源真正落地。
除了开源之外，对于HappyHorse而言，真正问题在于上线后能不能赢下市场。
即梦与可灵的壁垒，除了技术本身，还有与业务场景的深度融合。在电商直播、广告投放、内容分发等场景中，视频生成能力只是插件，流量分配权与业务流闭环才是真正的护城河。HappyHorse可以赢在盲测的第一眼惊艳里，但要进入真实生产流，还有更长的路要走。
与此同时，更残酷的现实是，技术领先的“保质期”正在急剧缩短。
从去年9月至今，可灵2.5Turbo、Seedance2.0、SkyReelsV4等模型轮流登顶，几乎每月一次“新王登基”。好耶科技创始人吴杰茜曾对「AIX财经」表示，视频大模型的竞争是一场永不停歇的烧钱长跑。一旦投入强度稍有松懈，或迭代速度慢于对手，用户会毫不犹豫地倒向更新、更强的模型。“赢家通吃”的法则，迫使厂商持续加码，稍有松懈即被淘汰。
HappyHorse的出现，短期内让享受Sora退场红利的头部厂商感受到了切实压力。长期来看，它向整个行业抛出了一组更本质的拷问：开源与闭源，哪种路径能跑通长效盈利？在迭代周期以月为单位的赛道里，真正的护城河究竟是模型本身，还是那张看不见的商业分发网络？
Sora的失败证明了一件事，技术领先不能替代商业闭环。而HappyHorse的出现提醒了另一件事：在开源浪潮面前，闭源模型的定价权与壁垒，或许比想象中更加脆弱。

免责声明：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益，请及时联系我们，本站将会在24小时内处理完毕。

同类资讯

谷歌联合美国航空利用AI优化飞行航线，减少飞机凝结尾迹出现概率

折叠屏 iPhone 在美国的售价预计将“突破 2000 美元大关”

苹果今天发布 iOS 26.4.1 更新：其中包含两项具体更改

“家庭新成员”升级，打造全场景跨设备协同智能终端

张雪峰变“AI技能包”引争议

Anthropic爆发意味着什么？美银：只要大模型继续狂奔，卖铲子和租算力的就稳赚不赔！

全站最新

谷歌联合美国航空利用AI优化飞行航线，减少飞机凝结尾迹出现概率

折叠屏 iPhone 在美国的售价预计将“突破 2000 美元大关”

苹果今天发布 iOS 26.4.1 更新：其中包含两项具体更改

“家庭新成员”升级，打造全场景跨设备协同智能终端

热门推荐

辛巴关联公司因虚假宣传被罚32万

黎万强、洪锋退股小米科技

陈丽华名下公司叫丽质华堂

万达集团所持北银消费金融公司股权被全部冻结

赛力斯公布防撞控制专利

宇树科技移动机器人专利获授权发明人为王兴兴等

东营辉煌绿色锂电新材料产业投资基金成立出资额约12亿

郭艾伦企业已注册篮球训练营商标

极氪汽车在温州成立新销售服务公司注册资本1000万

起底直播间涉黄牛奶关联公司

浙江杭资科创创业投资基金登记成立出资额20.02亿

CoreWeave与Meta宣布210亿美元扩展人工智能基础设施协议

三星将在越南投资40亿美元建设芯片封装厂

欣旺达装车特斯拉，供应全球车型｜36氪独家

谷歌联合美国航空利用AI优化飞行航线，减少飞机凝结尾迹出现概率