C
ChaoBro

Xiaomi MiMo-V2.5-ASR オープンソース:呉語・広東語・闽南語対応の方言認識新 breakthrough

Xiaomi MiMo-V2.5-ASR オープンソース:呉語・広東語・闽南語対応の方言認識新 breakthrough

概要

Xiaomiは4月30日にMiMo-V2.5-ASRをオープンソース化した。音声認識(ASR)に特化したモデルで、複数の中国方言をネイティブにサポート

能力説明
普通話標準中国語音声テキスト変換
英語標準英語音声テキスト変換
呉語上海語、蘇州語など
広東語广东語
闽南語福建・台湾闽南語
四川話西南官話
楽曲認識音楽付き音声コンテンツ
ノイズ環境騒がしい場面でのロバスト認識
マルチスピーカー同時複数話者認識

技術ハイライト

  • 統一アーキテクチャ:方言ごとに独立モデルではなく、単一モデルで全方言を処理
  • ノイズ・音楽シーン対応:音声特徴抽出能力が高いレベルに到達
  • マルチスピーカー認識:話者分離・切り替え検出・独立タグ付けをネイティブサポート

アクション推奨

  • 開発者: GitHubリポジトリのライセンス条項に注目、方言データをテスト
  • プロダクトマネージャー: 中国市場で方言ASRの明確なユーザーニーズ(数億人の方言話者)

Xiaomi MiMo-V2.5-ASRリリース情報とオープンソースコミュニティ議論に基づく。