阿里巴巴于 2026 年 4 月下旬正式推出多模态视频生成模型 HappyHorse 1.0(内部代号”快乐马”),目前已开启灰度测试。该模型在 Artificial Analysis Video Arena 多个子榜单中登顶,成为当前视频生成领域最受关注的新秀之一。
核心规格
HappyHorse 1.0 支持文生视频、图生视频、视频编辑及参考视频生成四种模式。单次生成可输出 3 至 15 秒的 1080P 分辨率视频,完整生成周期约 2 至 5 分钟。模型可解析长达 800 词的复杂提示词,支持多镜头叙事结构。
音视频联合生成是该模型的核心特性之一——在生成画面的同时同步输出配音与环境音,无需后期单独处理。唇形同步功能覆盖中文、英文、日文、法文、德文、西班牙文和阿拉伯文七种语言。
榜单表现
在 Artificial Analysis Video Arena 的 image-to-video(带音频)子榜单中,HappyHorse 1.0 排名第一,超越此前长期占据榜首的 Seedance 2.0。在 text-to-video 和视频编辑两个子项中,该模型同样进入前三。
多家第三方平台已陆续接入该模型,包括 Venice、OpenArt、APIMart、Muvi AI、Renoise、Pollo AI 和 HIX AI 等。部分平台在上线初期提供限时折扣。
社区反馈
早期灰度测试用户普遍认可该模型在人物特写场景的表现。35mm 至 85mm 焦段的人像生成中,背景虚化效果和人物细节保持度受到好评。多位从事海外短剧制作的用户指出,该模型生成的人脸自然度较此前产品有明显提升,适合直接用于商业化内容生产。
不过也有用户反馈,当人物置于大场景中时,模型偶发过拟合现象。在复杂场景构图方面,该模型仍存在优化空间。
定价与可用性
目前 HappyHorse 1.0 处于灰度测试阶段,部分平台通过赠送积分的方式降低用户体验门槛。正式定价尚未公布,已有 API 服务商按每次生成消耗约 90 积分的标准计费。
灰度测试期间,模型访问权限可能随时调整。建议关注各平台官方公告获取最新信息。