阿里 HappyHorse 1.0 登顶 Artificial Analysis，视频生成新标杆

阿里巴巴于 2026 年 4 月下旬正式推出多模态视频生成模型 HappyHorse 1.0（内部代号”快乐马”），目前已开启灰度测试。该模型在 Artificial Analysis Video Arena 多个子榜单中登顶，成为当前视频生成领域最受关注的新秀之一。

核心规格

HappyHorse 1.0 支持文生视频、图生视频、视频编辑及参考视频生成四种模式。单次生成可输出 3 至 15 秒的 1080P 分辨率视频，完整生成周期约 2 至 5 分钟。模型可解析长达 800 词的复杂提示词，支持多镜头叙事结构。

音视频联合生成是该模型的核心特性之一——在生成画面的同时同步输出配音与环境音，无需后期单独处理。唇形同步功能覆盖中文、英文、日文、法文、德文、西班牙文和阿拉伯文七种语言。

在 Artificial Analysis Video Arena 的 image-to-video（带音频）子榜单中，HappyHorse 1.0 排名第一，超越此前长期占据榜首的 Seedance 2.0。在 text-to-video 和视频编辑两个子项中，该模型同样进入前三。

多家第三方平台已陆续接入该模型，包括 Venice、OpenArt、APIMart、Muvi AI、Renoise、Pollo AI 和 HIX AI 等。部分平台在上线初期提供限时折扣。

早期灰度测试用户普遍认可该模型在人物特写场景的表现。35mm 至 85mm 焦段的人像生成中，背景虚化效果和人物细节保持度受到好评。多位从事海外短剧制作的用户指出，该模型生成的人脸自然度较此前产品有明显提升，适合直接用于商业化内容生产。

不过也有用户反馈，当人物置于大场景中时，模型偶发过拟合现象。在复杂场景构图方面，该模型仍存在优化空间。

目前 HappyHorse 1.0 处于灰度测试阶段，部分平台通过赠送积分的方式降低用户体验门槛。正式定价尚未公布，已有 API 服务商按每次生成消耗约 90 积分的标准计费。

灰度测试期间，模型访问权限可能随时调整。建议关注各平台官方公告获取最新信息。