邓文兵 66538592c8 fix(article): 更新 HappyHorse AI 视频分析文章内容

- 替换了封面图片为 HappyHorse 官网首页截图
- 移除了引子部分的标题修饰词"神秘黑马"
- 更新了 Image-to-Video 排行榜分数从 1406 Elo 到 1408 Elo
- 添加了 Artificial Analysis 排行榜对比图表
- 移除了嫌疑人介绍中的配图
- 添加了 daVinci-MagiHuman GitHub 仓库对比图表
- 添加了 HappyHorse 官网音画同步功能展示图
- 移除了 40层Transformer架构配图
- 添加了阿里巴巴股价走势图表
- 移除了时间线配图

2026-04-09 07:13:11 +08:00

11 KiB

Raw Permalink Blame History

神秘黑马 HappyHorse 空降屠榜！它凭什么碾压字节 Seedance 登顶 AI 视频第一？

发布日期：2026-04-08 分类：技术解读 / 深度分析作者：老邓唠AI

排行榜上突然冒出一匹"欢乐马"

4 月 5 号那天，我照常刷 Artificial Analysis 的 AI 视频排行榜——这是目前公认最靠谱的 AI 视频盲测排名，类似于大模型领域的 LMArena。

然后我就看到了一个从没见过的名字：HappyHorse 1.0。

排在第一。

不是第二第三慢慢爬上来的，是直接空降第一。Text-to-Video 第一，Image-to-Video 也是第一。之前霸榜好几周的字节 Seedance 2.0，被甩开了 60 多个 Elo 点。

最离谱的是——没有人知道这是谁做的。

没有发布会，没有技术博客，没有公司认领。Artificial Analysis 官方只说了一个词：pseudonymous，化名提交。

然后事情开始变得更魔幻：阿里股价当天暴涨 8%，因为有人扒出来这匹"欢乐马"可能跟阿里有关。再过两天，这个模型又从排行榜上消失了。

我研究了两天，今天把我能查到的所有信息整理出来，聊聊这匹马到底是什么来头。

先说成绩，到底有多强？

直接看数字。

在 Artificial Analysis Video Arena 上，HappyHorse 拿到了 Text-to-Video 约 1357 Elo，Image-to-Video 约 1408 Elo——后者是这个排行榜有史以来的最高分。

作为对比，之前的榜一 Seedance 2.0 的 Text-to-Video 是 1273 左右。快手的 Kling 3.0、PixVerse V6 都在更后面。

这个分数是怎么来的呢？大概 2000 个真人，看两段并排放的视频，不知道哪段是谁生成的，纯投票。视觉质量、物理真实性、跟 prompt 的契合度，全看人眼判断。

在人物生成这块尤其夸张。 排行榜上 60% 以上的盲测样本都是跟人相关的——面部表情、肢体动作、衣物褶皱这些，HappyHorse 的表现把其他模型拉开了一个档次。

说实话，我之前以为 Seedance 2.0 已经很难被超了。结果这匹马一来，直接把天花板掀了。

谁做的？目前有三个嫌疑人

这是整件事最有意思的地方。我翻遍了中英文社区，目前有三种说法，我一个一个讲。

第一种：阿里。 这是传播最广的猜测，也是阿里股价暴涨的直接原因。

关键人物是张迪——前快手副总裁，快手 Kling 视频模型的核心技术负责人。这哥们 2025 年底跳去了阿里淘天集团，组了个叫"未来生活实验室"的团队。一个做出了 Kling 的人，在阿里做视频 AI，时间线完全对得上。

但阿里到现在也没吭声。既没承认也没否认。

第二种：daVinci-MagiHuman 的马甲。 这是我觉得最靠谱的一个。

X 上有个叫 Vigo Zhao 的用户做了个非常硬核的参数比对，发现 HappyHorse 跟一个叫 daVinci-MagiHuman 的模型几乎一模一样——都是 150 亿参数，都是单流 Transformer 架构，都是单张 H100 上 2 秒生成 5 秒唇同步视频，都开源。

daVinci-MagiHuman 是上海创智研究院和北京 Sand.ai 在 3 月 23 号联合发布的。如果 HappyHorse 就是它的调优版换了个名字上榜，那"匿名提交"这事就不是什么神秘事件了——就是一次精心策划的炒作。

第三种：阿里 WAN 系列的新版本 WAN 2.7。 证据比较薄，主要是社区猜测。

我个人倾向第二种。参数级别这么高度吻合，很难用巧合解释。但不排除是阿里投资了 Sand.ai 然后把模型拿来调优的可能。

技术上到底有什么新东西？

抛开身份谜团，这个模型本身确实有几个值得聊的点。

第一个：音视频联合生成。

这可能是最重要的一点。你想想看，从 2024 年 Sora 发布到现在两年了，市面上所有主流 AI 视频工具生成的视频都是哑巴——没声音。你想要配音得自己去 ElevenLabs 或者 Suno 上搞，然后手动对齐。

HappyHorse 直接生成带声音的视频。而且不是那种嘴巴一张一合的糊弄，是真正针对不同语言做了唇形适配——英语、普通话、粤语、日语、韩语、德语、法语，7 种语言。

你用粤语 prompt 生成一段人说话的视频，嘴型就是粤语的。这个细节说明训练数据和模型架构都下了功夫。

第二个：架构设计挺讨巧。

40 层 Transformer，前后各 4 层是"模态专用层"，分别处理文本、视频、音频的输入输出；中间 32 层是共享层，三种模态的 token 混在同一序列里做 Self-Attention。

好处是什么？音画同步是模型"出生"就会的事，不需要后期再用一个对齐模块去匹配。这种端到端的联合建模，比"先生成视频再配音"的管线式方案优雅很多。

第三个：速度很快。

256p 分辨率大概 2 秒出一个 5 秒视频，1080p 大概 38 秒。这是单张 H100 的数据。对比来看，很多同类模型跑 1080p 要好几分钟。它用了一个叫 Timestep-free denoising 的推理加速方案，具体论文我还没扒到。

第四个：号称支持多镜头叙事。

就是你写一段 prompt，模型自动帮你切分成多个镜头，生成连贯的场景序列。如果这个真的靠谱，对短视频创作者来说太香了——等于省掉了分镜脚本和剪辑的步骤。但这个能力我没亲手试过，暂时存疑。

跟其他工具比，差距在哪？

直说吧。

论质量，它是盲测第一。2000 个真人投出来的结果，没什么好争的。

论价格，社区反馈 HappyHorse 的 API 定价大概是 Seedance 2.0 的一半。对需要批量生产视频的团队来说，这个差价足以影响选型。

论开放性，这才是真正的杀手锏——它是开源的。

Sora 闭源，Seedance 闭源，Kling 闭源。HappyHorse 给你模型权重、推理代码、蒸馏模型、超分辨率模块，还附带商用许可。你可以在自己服务器上跑，可以微调，可以拿它当基座做自己的产品。

开源模型登顶 AI 视频盲测排行榜，这是第一次。 在文本大模型领域，开源（LLaMA、Qwen）追平闭源用了两年多。视频领域这一天来得比我预想的快。

阿里股价涨 8%，合理吗？

说到钱的事就得直接点。

4 月 7 号阿里港股一度涨了 8%，市场的逻辑是：如果 HappyHorse 是阿里的，那阿里在 AI 视频赛道直接从追赶者变成了领跑者。再加上张迪（前 Kling 负责人）加盟的故事线，叙事很完美。

但我觉得这波涨得有点冲动。

原因很简单：到现在也没有任何官方确认 HappyHorse 跟阿里有关。 整条推理链是"张迪去了阿里 → 张迪以前做 Kling → HappyHorse 很强 → 所以 HappyHorse 是阿里的"——中间全是推测。

如果最后证实跟阿里没关系，这波追高的人就被叙事收割了。

更值得警觉的是，有人在讨论这是不是一种新型市场操纵：匿名提交模型 → 社区猜测关联某公司 → 股价上涨 → 获利。36 氪直接用了"鲶鱼"这个词来形容，意思是——你到底是来真的，还是来搅浑水的？

为什么突然消失了？

这是最诡异的部分。登顶才几天，HappyHorse 就从排行榜上没了。现在你去 Artificial Analysis 网站，已经找不到它了。

我猜了几个原因：

一是测试目的已经达到了。提交者只是想拿真人盲测验证一下模型水平，数据收集够了就撤。

二是在为正式发布铺路。先匿名登顶制造话题 → 全网猜谁做的 → 热度起来后官宣收割流量。这种打法在中国 AI 圈越来越常见了。

三是排行榜那边可能有要求。Artificial Analysis 可能对匿名提交的模型有身份验证的门槛，不满足就下架。

不管原因是什么，消失这件事本身反而让热度更高了。比起一个正常发布的模型，一个"来无影去无踪"的模型显然更有话题。

普通人现在能用吗？

不能。 至少目前不能。

虽然号称开源，但模型已经从排行榜消失、没有官方团队认领，现在没有可靠的官方下载渠道。

而且我要特别提醒：模型火了之后，一堆蹭热度的网站冒出来了——happyhorseai.com、happy-horse.art、happyhorse.app，这些都不是官方的。别在上面输入任何信息，更别付款。

如果你现在就想用 AI 视频生成，几个靠谱的选择：

想要质量最好的闭源产品：Seedance 2.0 或 Kling 3.0，排行榜二三名，都很能打
想要开源自部署：试试 daVinci-MagiHuman，跟 HappyHorse 参数几乎一样，已经正式开源了
想要音视频联合生成：目前没有成熟方案，等 HappyHorse 正式官宣吧

这件事给我的几个感受

聊了这么多细节，最后说说我自己的判断。

第一，AI 视频的"有声时代"要来了。 从 Sora 到现在两年，AI 视频一直是"默片"。HappyHorse 证明了端到端音视频联合生成在质量上已经能通过人类盲测。接下来不支持音频的模型，会像当年不支持彩色的电视一样被淘汰。

第二，中国团队已经吃下了 AI 视频的半壁江山。 你看看排行榜——Seedance 是字节的，Kling 是快手的，HappyHorse 疑似阿里或 Sand.ai 的。前几名几乎全是中国队。Sora 还在，但已经不在最前面了。AI 文本领域是美国领先，AI 视频领域中国已经打到前排了。

第三，"匿名登榜"这种操作以后可能会越来越多。 零成本验证市场反应，还能制造话题。但代价是排行榜的公信力会被消耗——如果谁都可以匿名提交、登顶、消失，那排名还有多少参考价值？

这匹马跑完了它的第一圈。至于它到底是谁家的马，我赌不了太久就会有答案。

到时候再来唠。

关注「老邓唠AI」，第一时间拆解最前沿的 AI 动态。

11 KiB Raw Permalink Blame History Unescape Escape