diff --git a/articles/009-神秘黑马HappyHorse空降屠榜!它凭什么碾压字节Seedance登顶AI视频第一.md b/articles/009-神秘黑马HappyHorse空降屠榜!它凭什么碾压字节Seedance登顶AI视频第一.md index ee96396..1f3bba5 100644 --- a/articles/009-神秘黑马HappyHorse空降屠榜!它凭什么碾压字节Seedance登顶AI视频第一.md +++ b/articles/009-神秘黑马HappyHorse空降屠榜!它凭什么碾压字节Seedance登顶AI视频第一.md @@ -4,9 +4,9 @@ > 分类:技术解读 / 深度分析 > 作者:老邓唠AI -![封面](https://cdn.union.jxyunge.com/self-media/009/cover.png) +![HappyHorse 官网首页](https://cdn.union.jxyunge.com/self-media/009/happyhorse-official.png) -## 引子:排行榜上突然冒出一匹"欢乐马" +## 排行榜上突然冒出一匹"欢乐马" 4 月 5 号那天,我照常刷 Artificial Analysis 的 AI 视频排行榜——这是目前公认最靠谱的 AI 视频盲测排名,类似于大模型领域的 LMArena。 @@ -28,11 +28,13 @@ ## 先说成绩,到底有多强? -![AI视频模型排行榜对比](https://cdn.union.jxyunge.com/self-media/009/ranking.png) - 直接看数字。 -在 Artificial Analysis Video Arena 上,HappyHorse 拿到了 Text-to-Video 约 **1357 Elo**,Image-to-Video 约 **1406 Elo**——后者是这个排行榜有史以来的最高分。 +在 Artificial Analysis Video Arena 上,HappyHorse 拿到了 Text-to-Video 约 **1357 Elo**,Image-to-Video 约 **1408 Elo**——后者是这个排行榜有史以来的最高分。 + +![Artificial Analysis Text-to-Video 排行榜:HappyHorse 1.0 以 1357 Elo 登顶](https://cdn.union.jxyunge.com/self-media/009/leaderboard-t2v.png) + +![Image-to-Video 排行榜:HappyHorse 1.0 Elo 1408,领先 Seedance 2.0 超过 50 分](https://cdn.union.jxyunge.com/self-media/009/leaderboard-i2v.png) 作为对比,之前的榜一 Seedance 2.0 的 Text-to-Video 是 1273 左右。快手的 Kling 3.0、PixVerse V6 都在更后面。 @@ -46,8 +48,6 @@ ## 谁做的?目前有三个嫌疑人 -![谁是HappyHorse?](https://cdn.union.jxyunge.com/self-media/009/suspects.png) - 这是整件事最有意思的地方。我翻遍了中英文社区,目前有三种说法,我一个一个讲。 **第一种:阿里。** 这是传播最广的猜测,也是阿里股价暴涨的直接原因。 @@ -62,6 +62,8 @@ X 上有个叫 Vigo Zhao 的用户做了个非常硬核的参数比对,发现 daVinci-MagiHuman 是上海创智研究院和北京 Sand.ai 在 3 月 23 号联合发布的。如果 HappyHorse 就是它的调优版换了个名字上榜,那"匿名提交"这事就不是什么神秘事件了——就是一次精心策划的炒作。 +![daVinci-MagiHuman GitHub 仓库:参数、架构与 HappyHorse 高度吻合](https://cdn.union.jxyunge.com/self-media/009/davinci-github.png) + **第三种:阿里 WAN 系列的新版本 WAN 2.7。** 证据比较薄,主要是社区猜测。 我个人倾向第二种。参数级别这么高度吻合,很难用巧合解释。但不排除是阿里投资了 Sand.ai 然后把模型拿来调优的可能。 @@ -80,9 +82,9 @@ HappyHorse 直接生成**带声音的视频**。而且不是那种嘴巴一张 你用粤语 prompt 生成一段人说话的视频,嘴型就是粤语的。这个细节说明训练数据和模型架构都下了功夫。 -**第二个:架构设计挺讨巧。** +![HappyHorse 官网展示的 Audio-Visual Sync 功能](https://cdn.union.jxyunge.com/self-media/009/features-audiosync.png) -![40层Transformer架构](https://cdn.union.jxyunge.com/self-media/009/architecture.png) +**第二个:架构设计挺讨巧。** 40 层 Transformer,前后各 4 层是"模态专用层",分别处理文本、视频、音频的输入输出;中间 32 层是共享层,三种模态的 token 混在同一序列里做 Self-Attention。 @@ -118,6 +120,8 @@ Sora 闭源,Seedance 闭源,Kling 闭源。HappyHorse 给你模型权重、 说到钱的事就得直接点。 +![阿里巴巴(BABA)股价走势:HappyHorse 消息传出后一度暴涨近 8%](https://cdn.union.jxyunge.com/self-media/009/baba-stock.png) + 4 月 7 号阿里港股一度涨了 8%,市场的逻辑是:如果 HappyHorse 是阿里的,那阿里在 AI 视频赛道直接从追赶者变成了领跑者。再加上张迪(前 Kling 负责人)加盟的故事线,叙事很完美。 但我觉得这波涨得有点冲动。 @@ -162,8 +166,6 @@ Sora 闭源,Seedance 闭源,Kling 闭源。HappyHorse 给你模型权重、 --- -![HappyHorse事件时间线](https://cdn.union.jxyunge.com/self-media/009/timeline.png) - ## 这件事给我的几个感受 聊了这么多细节,最后说说我自己的判断。 diff --git a/articles/009/architecture.png b/articles/009/architecture.png index b461530..54a27fa 100644 Binary files a/articles/009/architecture.png and b/articles/009/architecture.png differ diff --git a/articles/009/landscape.png b/articles/009/landscape.png new file mode 100644 index 0000000..a195349 Binary files /dev/null and b/articles/009/landscape.png differ diff --git a/articles/009/leaderboard1.png b/articles/009/leaderboard1.png new file mode 100644 index 0000000..0f7aff7 Binary files /dev/null and b/articles/009/leaderboard1.png differ diff --git a/articles/009/leaderboard2.png b/articles/009/leaderboard2.png new file mode 100644 index 0000000..3df5130 Binary files /dev/null and b/articles/009/leaderboard2.png differ diff --git a/articles/009/vs-seedance.png b/articles/009/vs-seedance.png new file mode 100644 index 0000000..8b17afd Binary files /dev/null and b/articles/009/vs-seedance.png differ