C
ChaoBro

バークレーのFSTフレームワーク:LLMは「問題を解けるが新しいことを学べない天才」になりつつある

バークレーのFSTフレームワーク:LLMは「問題を解けるが新しいことを学べない天才」になりつつある

過去2年間、すべてのトップAIラボが同じことをやっていた:モデルをより深く考えさせること。

バークレーの研究者たちは誰も聞きたくない質問を投げかけた:モデルが「問題を解けるが新しいことを学べない天才」になりつつあるなら、私たちが賭けているのは一体何か?

実験:同一LLMに3つのタスクを連続学習させる。従来のRLは2つ目のタスクで完全に詰まった。FSTは3つともクリア。


主要情報源: