アリババは 2026 年 4 月下旬、マルチモーダル動画生成モデル HappyHorse 1.0(内部コード名「快樂馬」)を正式にリリースし、現在グレーテスト(限定公開テスト)を実施中である。本モデルは Artificial Analysis Video Arena の複数のサブリーダーボードで首位を獲得し、動画生成分野で最も注目される新星の一つとなっている。
主要仕様
HappyHorse 1.0 は、テキストから動画、画像から動画、動画編集、参照動画からの生成の 4 つのモードをサポートする。1 回の生成で 1080P 解像度、3〜15 秒の動画を出力可能。完全な生成サイクルは約 2〜5 分である。モデルは最大 800 語の複雑なプロンプトを解析でき、マルチショットの叙事構造にも対応する。
音声と動画の同時生成は本モデルのコア機能の一つであり、映像の生成と同時にナレーションや環境音を同期出力し、事後処理が不要である。リップシンク機能は中国語、英語、日本語、フランス語、ドイツ語、スペイン語、アラビア語の 7 カ国語をカバーする。
ランキング
Artificial Analysis Video Arena の image-to-video(音声付き)サブリーダーボードにおいて、HappyHorse 1.0 は 1 位を獲得。従来長期間首位にあった Seedance 2.0 を上回った。text-to-video と動画編集の 2 つのサブカテゴリーでもトップ 3 にランクインしている。
Venice、OpenArt、APIMart、Muvi AI、Renoise、Pollo AI、HIX AI など、複数のサードパーティプラットフォームが本モデルを統合している。一部のプラットフォームはローンチ初期に期間限定割引を提供中である。
コミュニティフィードバック
初期グレーテストユーザーは、ポートレート接写シーンにおける本モデルのパフォーマンスを概ね評価している。35mm〜85mm の焦点距離における人物生成では、背景ぼかし効果と人物ディテールの保持が好評である。海外短ドラマ制作に携わる複数のユーザーは、生成された顔の自然さが従来製品と比較して大幅に向上しており、商業コンテンツ制作に直接使用できると指摘している。
一方で、人物が大規模シーンに配置される場合、モデルが過学習を起こすことがあるとの報告もある。複雑なシーン構成については、まだ最適化の余地が残されている。
価格と利用可能性
現在 HappyHorse 1.0 はグレーテスト段階にあり、一部のプラットフォームは無料クレジットを提供して体験のハードルを下げている。正式な価格はまだ発表されていない。既存の API サービスプロバイダーは、1 回あたり約 90 クレジットを課金している。
グレーテスト期間中、モデルへのアクセスはいつでも調整される可能性がある。最新情報は各プラットフォームの公式発表を確認されたい。