self-media-james/articles/009-神秘黑马HappyHorse空降屠榜!它凭什么碾压字节Seedance登顶AI视频第一.md
邓文兵 66538592c8 fix(article): 更新 HappyHorse AI 视频分析文章内容
- 替换了封面图片为 HappyHorse 官网首页截图
- 移除了引子部分的标题修饰词"神秘黑马"
- 更新了 Image-to-Video 排行榜分数从 1406 Elo 到 1408 Elo
- 添加了 Artificial Analysis 排行榜对比图表
- 移除了嫌疑人介绍中的配图
- 添加了 daVinci-MagiHuman GitHub 仓库对比图表
- 添加了 HappyHorse 官网音画同步功能展示图
- 移除了 40层Transformer架构配图
- 添加了阿里巴巴股价走势图表
- 移除了时间线配图
2026-04-09 07:13:11 +08:00

11 KiB
Raw Permalink Blame History

神秘黑马 HappyHorse 空降屠榜!它凭什么碾压字节 Seedance 登顶 AI 视频第一?

发布日期2026-04-08 分类:技术解读 / 深度分析 作者老邓唠AI

HappyHorse 官网首页

排行榜上突然冒出一匹"欢乐马"

4 月 5 号那天,我照常刷 Artificial Analysis 的 AI 视频排行榜——这是目前公认最靠谱的 AI 视频盲测排名,类似于大模型领域的 LMArena。

然后我就看到了一个从没见过的名字:HappyHorse 1.0

排在第一。

不是第二第三慢慢爬上来的是直接空降第一。Text-to-Video 第一Image-to-Video 也是第一。之前霸榜好几周的字节 Seedance 2.0,被甩开了 60 多个 Elo 点。

最离谱的是——没有人知道这是谁做的。

没有发布会没有技术博客没有公司认领。Artificial Analysis 官方只说了一个词:pseudonymous,化名提交。

然后事情开始变得更魔幻:阿里股价当天暴涨 8%,因为有人扒出来这匹"欢乐马"可能跟阿里有关。再过两天,这个模型又从排行榜上消失了

我研究了两天,今天把我能查到的所有信息整理出来,聊聊这匹马到底是什么来头。


先说成绩,到底有多强?

直接看数字。

在 Artificial Analysis Video Arena 上HappyHorse 拿到了 Text-to-Video 约 1357 EloImage-to-Video 约 1408 Elo——后者是这个排行榜有史以来的最高分。

Artificial Analysis Text-to-Video 排行榜:HappyHorse 1.0 以 1357 Elo 登顶

Image-to-Video 排行榜:HappyHorse 1.0 Elo 1408,领先 Seedance 2.0 超过 50 分

作为对比,之前的榜一 Seedance 2.0 的 Text-to-Video 是 1273 左右。快手的 Kling 3.0、PixVerse V6 都在更后面。

这个分数是怎么来的呢?大概 2000 个真人,看两段并排放的视频,不知道哪段是谁生成的,纯投票。视觉质量、物理真实性、跟 prompt 的契合度,全看人眼判断。

在人物生成这块尤其夸张。 排行榜上 60% 以上的盲测样本都是跟人相关的——面部表情、肢体动作、衣物褶皱这些HappyHorse 的表现把其他模型拉开了一个档次。

说实话,我之前以为 Seedance 2.0 已经很难被超了。结果这匹马一来,直接把天花板掀了。


谁做的?目前有三个嫌疑人

这是整件事最有意思的地方。我翻遍了中英文社区,目前有三种说法,我一个一个讲。

第一种:阿里。 这是传播最广的猜测,也是阿里股价暴涨的直接原因。

关键人物是张迪——前快手副总裁,快手 Kling 视频模型的核心技术负责人。这哥们 2025 年底跳去了阿里淘天集团,组了个叫"未来生活实验室"的团队。一个做出了 Kling 的人,在阿里做视频 AI时间线完全对得上。

但阿里到现在也没吭声。既没承认也没否认。

第二种daVinci-MagiHuman 的马甲。 这是我觉得最靠谱的一个。

X 上有个叫 Vigo Zhao 的用户做了个非常硬核的参数比对,发现 HappyHorse 跟一个叫 daVinci-MagiHuman 的模型几乎一模一样——都是 150 亿参数,都是单流 Transformer 架构,都是单张 H100 上 2 秒生成 5 秒唇同步视频,都开源。

daVinci-MagiHuman 是上海创智研究院和北京 Sand.ai 在 3 月 23 号联合发布的。如果 HappyHorse 就是它的调优版换了个名字上榜,那"匿名提交"这事就不是什么神秘事件了——就是一次精心策划的炒作。

daVinci-MagiHuman GitHub 仓库:参数、架构与 HappyHorse 高度吻合

第三种:阿里 WAN 系列的新版本 WAN 2.7。 证据比较薄,主要是社区猜测。

我个人倾向第二种。参数级别这么高度吻合,很难用巧合解释。但不排除是阿里投资了 Sand.ai 然后把模型拿来调优的可能。


技术上到底有什么新东西?

抛开身份谜团,这个模型本身确实有几个值得聊的点。

第一个:音视频联合生成。

这可能是最重要的一点。你想想看,从 2024 年 Sora 发布到现在两年了,市面上所有主流 AI 视频工具生成的视频都是哑巴——没声音。你想要配音得自己去 ElevenLabs 或者 Suno 上搞,然后手动对齐。

HappyHorse 直接生成带声音的视频。而且不是那种嘴巴一张一合的糊弄是真正针对不同语言做了唇形适配——英语、普通话、粤语、日语、韩语、德语、法语7 种语言。

你用粤语 prompt 生成一段人说话的视频,嘴型就是粤语的。这个细节说明训练数据和模型架构都下了功夫。

HappyHorse 官网展示的 Audio-Visual Sync 功能

第二个:架构设计挺讨巧。

40 层 Transformer前后各 4 层是"模态专用层",分别处理文本、视频、音频的输入输出;中间 32 层是共享层,三种模态的 token 混在同一序列里做 Self-Attention。

好处是什么?音画同步是模型"出生"就会的事,不需要后期再用一个对齐模块去匹配。这种端到端的联合建模,比"先生成视频再配音"的管线式方案优雅很多。

第三个:速度很快。

256p 分辨率大概 2 秒出一个 5 秒视频1080p 大概 38 秒。这是单张 H100 的数据。对比来看,很多同类模型跑 1080p 要好几分钟。它用了一个叫 Timestep-free denoising 的推理加速方案,具体论文我还没扒到。

第四个:号称支持多镜头叙事。

就是你写一段 prompt模型自动帮你切分成多个镜头生成连贯的场景序列。如果这个真的靠谱对短视频创作者来说太香了——等于省掉了分镜脚本和剪辑的步骤。但这个能力我没亲手试过暂时存疑。


跟其他工具比,差距在哪?

直说吧。

论质量它是盲测第一。2000 个真人投出来的结果,没什么好争的。

论价格,社区反馈 HappyHorse 的 API 定价大概是 Seedance 2.0 的一半。对需要批量生产视频的团队来说,这个差价足以影响选型。

论开放性,这才是真正的杀手锏——它是开源的。

Sora 闭源Seedance 闭源Kling 闭源。HappyHorse 给你模型权重、推理代码、蒸馏模型、超分辨率模块,还附带商用许可。你可以在自己服务器上跑,可以微调,可以拿它当基座做自己的产品。

开源模型登顶 AI 视频盲测排行榜,这是第一次。 在文本大模型领域开源LLaMA、Qwen追平闭源用了两年多。视频领域这一天来得比我预想的快。


阿里股价涨 8%,合理吗?

说到钱的事就得直接点。

阿里巴巴(BABA)股价走势:HappyHorse 消息传出后一度暴涨近 8%

4 月 7 号阿里港股一度涨了 8%,市场的逻辑是:如果 HappyHorse 是阿里的,那阿里在 AI 视频赛道直接从追赶者变成了领跑者。再加上张迪(前 Kling 负责人)加盟的故事线,叙事很完美。

但我觉得这波涨得有点冲动。

原因很简单:到现在也没有任何官方确认 HappyHorse 跟阿里有关。 整条推理链是"张迪去了阿里 → 张迪以前做 Kling → HappyHorse 很强 → 所以 HappyHorse 是阿里的"——中间全是推测。

如果最后证实跟阿里没关系,这波追高的人就被叙事收割了。

更值得警觉的是,有人在讨论这是不是一种新型市场操纵:匿名提交模型 → 社区猜测关联某公司 → 股价上涨 → 获利。36 氪直接用了"鲶鱼"这个词来形容,意思是——你到底是来真的,还是来搅浑水的?


为什么突然消失了?

这是最诡异的部分。登顶才几天HappyHorse 就从排行榜上没了。现在你去 Artificial Analysis 网站,已经找不到它了。

我猜了几个原因:

一是测试目的已经达到了。提交者只是想拿真人盲测验证一下模型水平,数据收集够了就撤。

二是在为正式发布铺路。先匿名登顶制造话题 → 全网猜谁做的 → 热度起来后官宣收割流量。这种打法在中国 AI 圈越来越常见了。

三是排行榜那边可能有要求。Artificial Analysis 可能对匿名提交的模型有身份验证的门槛,不满足就下架。

不管原因是什么,消失这件事本身反而让热度更高了。比起一个正常发布的模型,一个"来无影去无踪"的模型显然更有话题。


普通人现在能用吗?

不能。 至少目前不能。

虽然号称开源,但模型已经从排行榜消失、没有官方团队认领,现在没有可靠的官方下载渠道

而且我要特别提醒模型火了之后一堆蹭热度的网站冒出来了——happyhorseai.com、happy-horse.art、happyhorse.app这些都不是官方的。别在上面输入任何信息,更别付款。

如果你现在就想用 AI 视频生成,几个靠谱的选择:

  • 想要质量最好的闭源产品Seedance 2.0 或 Kling 3.0,排行榜二三名,都很能打
  • 想要开源自部署:试试 daVinci-MagiHuman跟 HappyHorse 参数几乎一样,已经正式开源了
  • 想要音视频联合生成:目前没有成熟方案,等 HappyHorse 正式官宣吧

这件事给我的几个感受

聊了这么多细节,最后说说我自己的判断。

第一AI 视频的"有声时代"要来了。 从 Sora 到现在两年AI 视频一直是"默片"。HappyHorse 证明了端到端音视频联合生成在质量上已经能通过人类盲测。接下来不支持音频的模型,会像当年不支持彩色的电视一样被淘汰。

第二,中国团队已经吃下了 AI 视频的半壁江山。 你看看排行榜——Seedance 是字节的Kling 是快手的HappyHorse 疑似阿里或 Sand.ai 的。前几名几乎全是中国队。Sora 还在但已经不在最前面了。AI 文本领域是美国领先AI 视频领域中国已经打到前排了。

第三,"匿名登榜"这种操作以后可能会越来越多。 零成本验证市场反应,还能制造话题。但代价是排行榜的公信力会被消耗——如果谁都可以匿名提交、登顶、消失,那排名还有多少参考价值?

这匹马跑完了它的第一圈。至于它到底是谁家的马,我赌不了太久就会有答案。

到时候再来唠。


关注「老邓唠AI」第一时间拆解最前沿的 AI 动态。