feat(article): 新增AI视频模型HappyHorse深度分析文章

- 分析了HappyHorse模型的技术特点和性能表现
- 探讨了模型背后的可能开发者身份猜测
- 介绍了音视频联合生成等关键技术创新
- 对比了与其他AI视频工具的优劣势差异
- 讨论了模型开源和商业应用前景
- 分析了对AI视频行业格局的影响趋势
This commit is contained in:
邓文兵 2026-04-08 22:32:35 +08:00
parent 0686f1969c
commit d994f8f427
17 changed files with 183 additions and 0 deletions

View File

@ -0,0 +1,183 @@
# 神秘黑马 HappyHorse 空降屠榜!它凭什么碾压字节 Seedance 登顶 AI 视频第一?
> 发布日期2026-04-08
> 分类:技术解读 / 深度分析
> 作者老邓唠AI
![封面](https://cdn.union.jxyunge.com/self-media/009/cover.png)
## 引子:排行榜上突然冒出一匹"欢乐马"
4 月 5 号那天,我照常刷 Artificial Analysis 的 AI 视频排行榜——这是目前公认最靠谱的 AI 视频盲测排名,类似于大模型领域的 LMArena。
然后我就看到了一个从没见过的名字:**HappyHorse 1.0**。
排在第一。
不是第二第三慢慢爬上来的是直接空降第一。Text-to-Video 第一Image-to-Video 也是第一。之前霸榜好几周的字节 Seedance 2.0,被甩开了 60 多个 Elo 点。
最离谱的是——**没有人知道这是谁做的。**
没有发布会没有技术博客没有公司认领。Artificial Analysis 官方只说了一个词:**pseudonymous**,化名提交。
然后事情开始变得更魔幻:阿里股价当天暴涨 8%,因为有人扒出来这匹"欢乐马"可能跟阿里有关。再过两天,这个模型又从排行榜上**消失了**。
我研究了两天,今天把我能查到的所有信息整理出来,聊聊这匹马到底是什么来头。
---
## 先说成绩,到底有多强?
![AI视频模型排行榜对比](https://cdn.union.jxyunge.com/self-media/009/ranking.png)
直接看数字。
在 Artificial Analysis Video Arena 上HappyHorse 拿到了 Text-to-Video 约 **1357 Elo**Image-to-Video 约 **1406 Elo**——后者是这个排行榜有史以来的最高分。
作为对比,之前的榜一 Seedance 2.0 的 Text-to-Video 是 1273 左右。快手的 Kling 3.0、PixVerse V6 都在更后面。
这个分数是怎么来的呢?大概 2000 个真人,看两段并排放的视频,不知道哪段是谁生成的,纯投票。视觉质量、物理真实性、跟 prompt 的契合度,全看人眼判断。
**在人物生成这块尤其夸张。** 排行榜上 60% 以上的盲测样本都是跟人相关的——面部表情、肢体动作、衣物褶皱这些HappyHorse 的表现把其他模型拉开了一个档次。
说实话,我之前以为 Seedance 2.0 已经很难被超了。结果这匹马一来,直接把天花板掀了。
---
## 谁做的?目前有三个嫌疑人
![谁是HappyHorse](https://cdn.union.jxyunge.com/self-media/009/suspects.png)
这是整件事最有意思的地方。我翻遍了中英文社区,目前有三种说法,我一个一个讲。
**第一种:阿里。** 这是传播最广的猜测,也是阿里股价暴涨的直接原因。
关键人物是**张迪**——前快手副总裁,快手 Kling 视频模型的核心技术负责人。这哥们 2025 年底跳去了阿里淘天集团,组了个叫"未来生活实验室"的团队。一个做出了 Kling 的人,在阿里做视频 AI时间线完全对得上。
但阿里到现在也没吭声。既没承认也没否认。
**第二种daVinci-MagiHuman 的马甲。** 这是我觉得最靠谱的一个。
X 上有个叫 Vigo Zhao 的用户做了个非常硬核的参数比对,发现 HappyHorse 跟一个叫 **daVinci-MagiHuman** 的模型**几乎一模一样**——都是 150 亿参数,都是单流 Transformer 架构,都是单张 H100 上 2 秒生成 5 秒唇同步视频,都开源。
daVinci-MagiHuman 是上海创智研究院和北京 Sand.ai 在 3 月 23 号联合发布的。如果 HappyHorse 就是它的调优版换了个名字上榜,那"匿名提交"这事就不是什么神秘事件了——就是一次精心策划的炒作。
**第三种:阿里 WAN 系列的新版本 WAN 2.7。** 证据比较薄,主要是社区猜测。
我个人倾向第二种。参数级别这么高度吻合,很难用巧合解释。但不排除是阿里投资了 Sand.ai 然后把模型拿来调优的可能。
---
## 技术上到底有什么新东西?
抛开身份谜团,这个模型本身确实有几个值得聊的点。
**第一个:音视频联合生成。**
这可能是最重要的一点。你想想看,从 2024 年 Sora 发布到现在两年了,市面上所有主流 AI 视频工具生成的视频都是**哑巴**——没声音。你想要配音得自己去 ElevenLabs 或者 Suno 上搞,然后手动对齐。
HappyHorse 直接生成**带声音的视频**。而且不是那种嘴巴一张一合的糊弄是真正针对不同语言做了唇形适配——英语、普通话、粤语、日语、韩语、德语、法语7 种语言。
你用粤语 prompt 生成一段人说话的视频,嘴型就是粤语的。这个细节说明训练数据和模型架构都下了功夫。
**第二个:架构设计挺讨巧。**
![40层Transformer架构](https://cdn.union.jxyunge.com/self-media/009/architecture.png)
40 层 Transformer前后各 4 层是"模态专用层",分别处理文本、视频、音频的输入输出;中间 32 层是共享层,三种模态的 token 混在同一序列里做 Self-Attention。
好处是什么?音画同步是模型"出生"就会的事,不需要后期再用一个对齐模块去匹配。这种端到端的联合建模,比"先生成视频再配音"的管线式方案优雅很多。
**第三个:速度很快。**
256p 分辨率大概 2 秒出一个 5 秒视频1080p 大概 38 秒。这是单张 H100 的数据。对比来看,很多同类模型跑 1080p 要好几分钟。它用了一个叫 Timestep-free denoising 的推理加速方案,具体论文我还没扒到。
**第四个:号称支持多镜头叙事。**
就是你写一段 prompt模型自动帮你切分成多个镜头生成连贯的场景序列。如果这个真的靠谱对短视频创作者来说太香了——等于省掉了分镜脚本和剪辑的步骤。但这个能力我没亲手试过暂时存疑。
---
## 跟其他工具比,差距在哪?
直说吧。
**论质量**它是盲测第一。2000 个真人投出来的结果,没什么好争的。
**论价格**,社区反馈 HappyHorse 的 API 定价大概是 Seedance 2.0 的一半。对需要批量生产视频的团队来说,这个差价足以影响选型。
**论开放性**,这才是真正的杀手锏——它是开源的。
Sora 闭源Seedance 闭源Kling 闭源。HappyHorse 给你模型权重、推理代码、蒸馏模型、超分辨率模块,还附带商用许可。你可以在自己服务器上跑,可以微调,可以拿它当基座做自己的产品。
**开源模型登顶 AI 视频盲测排行榜,这是第一次。** 在文本大模型领域开源LLaMA、Qwen追平闭源用了两年多。视频领域这一天来得比我预想的快。
---
## 阿里股价涨 8%,合理吗?
说到钱的事就得直接点。
4 月 7 号阿里港股一度涨了 8%,市场的逻辑是:如果 HappyHorse 是阿里的,那阿里在 AI 视频赛道直接从追赶者变成了领跑者。再加上张迪(前 Kling 负责人)加盟的故事线,叙事很完美。
但我觉得这波涨得有点冲动。
原因很简单:**到现在也没有任何官方确认 HappyHorse 跟阿里有关。** 整条推理链是"张迪去了阿里 → 张迪以前做 Kling → HappyHorse 很强 → 所以 HappyHorse 是阿里的"——中间全是推测。
如果最后证实跟阿里没关系,这波追高的人就被叙事收割了。
更值得警觉的是,有人在讨论这是不是一种新型市场操纵:匿名提交模型 → 社区猜测关联某公司 → 股价上涨 → 获利。36 氪直接用了"鲶鱼"这个词来形容,意思是——你到底是来真的,还是来搅浑水的?
---
## 为什么突然消失了?
这是最诡异的部分。登顶才几天HappyHorse 就从排行榜上没了。现在你去 Artificial Analysis 网站,已经找不到它了。
我猜了几个原因:
一是**测试目的已经达到了**。提交者只是想拿真人盲测验证一下模型水平,数据收集够了就撤。
二是**在为正式发布铺路**。先匿名登顶制造话题 → 全网猜谁做的 → 热度起来后官宣收割流量。这种打法在中国 AI 圈越来越常见了。
三是**排行榜那边可能有要求**。Artificial Analysis 可能对匿名提交的模型有身份验证的门槛,不满足就下架。
不管原因是什么,消失这件事本身反而让热度更高了。比起一个正常发布的模型,一个"来无影去无踪"的模型显然更有话题。
---
## 普通人现在能用吗?
**不能。** 至少目前不能。
虽然号称开源,但模型已经从排行榜消失、没有官方团队认领,现在**没有可靠的官方下载渠道**。
而且我要特别提醒模型火了之后一堆蹭热度的网站冒出来了——happyhorseai.com、happy-horse.art、happyhorse.app这些**都不是官方的**。别在上面输入任何信息,更别付款。
如果你现在就想用 AI 视频生成,几个靠谱的选择:
- **想要质量最好的闭源产品**Seedance 2.0 或 Kling 3.0,排行榜二三名,都很能打
- **想要开源自部署**:试试 daVinci-MagiHuman跟 HappyHorse 参数几乎一样,已经正式开源了
- **想要音视频联合生成**:目前没有成熟方案,等 HappyHorse 正式官宣吧
---
![HappyHorse事件时间线](https://cdn.union.jxyunge.com/self-media/009/timeline.png)
## 这件事给我的几个感受
聊了这么多细节,最后说说我自己的判断。
**第一AI 视频的"有声时代"要来了。** 从 Sora 到现在两年AI 视频一直是"默片"。HappyHorse 证明了端到端音视频联合生成在质量上已经能通过人类盲测。接下来不支持音频的模型,会像当年不支持彩色的电视一样被淘汰。
**第二,中国团队已经吃下了 AI 视频的半壁江山。** 你看看排行榜——Seedance 是字节的Kling 是快手的HappyHorse 疑似阿里或 Sand.ai 的。前几名几乎全是中国队。Sora 还在但已经不在最前面了。AI 文本领域是美国领先AI 视频领域中国已经打到前排了。
**第三,"匿名登榜"这种操作以后可能会越来越多。** 零成本验证市场反应,还能制造话题。但代价是排行榜的公信力会被消耗——如果谁都可以匿名提交、登顶、消失,那排名还有多少参考价值?
这匹马跑完了它的第一圈。至于它到底是谁家的马,我赌不了太久就会有答案。
到时候再来唠。
---
*关注「老邓唠AI」第一时间拆解最前沿的 AI 动态。*

Binary file not shown.

After

Width:  |  Height:  |  Size: 409 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 1.1 MiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 236 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 169 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 402 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 606 KiB

BIN
articles/009/cover.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 827 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 672 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 389 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 939 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 691 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 888 KiB

BIN
articles/009/ranking.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 590 KiB

BIN
articles/009/suspects.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 919 KiB

BIN
articles/009/timeline.png Normal file

Binary file not shown.

After

Width:  |  Height:  |  Size: 601 KiB

Binary file not shown.

After

Width:  |  Height:  |  Size: 792 KiB