C
ChaoBro

羅福莉 3.5 時間インタビュー:Pre-train 格差消失後、Agent RL が中国モデルの勝敗を分ける

羅福莉 3.5 時間インタビュー:Pre-train 格差消失後、Agent RL が中国モデルの勝敗を分ける

核心評価

小米大模型チーム責任者 羅福莉が 2026 年 4 月下旬に 3.5 時間の技術深度インタビューを受けました。

核心观点

1. Pre-train 格差はほぼ消失

国内トップチームと Anthropic との間の Pre-train レベルの格差は急速に縮小しています。

2. Agent RL が次の勝敗手

Pre-train が壁ではなくなった今、競争次元は Agent 強化学習(Agent RL) にシフトします。

3. 人材選択:空杯マインド

羅福莉はインターン生の選択基準を明らかにしました — 学習能力と好奇心が非常に強い人

アドバイス

役割アクション
モデル開発者Agent RL をコア R&D 方向に
アプリ開発者MiMo Orbit 無料枠を活用
求職者Agent フレームワーク経験を強化