LeCun 赌注 JEPA：万亿资金押错方向？世界模型与 LLM 的终极路线之争

核心结论

AI行业正在面临一个根本性的路线分歧：

维度	LLM路线（主流）	JEPA路线（LeCun）
核心架构	Transformer + Next-Token Prediction	Joint Embedding Predictive Architecture
训练方式	海量文本生成预测	联合嵌入空间中的世界状态预测
生成方式	自回归逐token生成	非生成式，在嵌入空间推理
物理理解	隐含学习（可能学会）	显式编码（设计保证）
计算效率	推理成本高（逐个生成）	规划速度快（嵌入空间操作）
典型玩家	OpenAI, Anthropic, Google, 国产模型	Meta (LeCun团队)

LeCun的最新实验中，极小参数+单张GPU就实现了天然编码物理规律+超快规划。这与当前动辄千亿参数、万张GPU的LLM训练形成了鲜明对比。

LeCun从LLM热潮初期就反复强调一个问题：

“如果让模型足够大，它最终会理解世界是如何运行的——这个假设从未被证明。”

他的批评可以归纳为三点：

LLM通过”预测下一个词”来学习，这种方式：

JEPA的核心思想是：

这类似于人类思考的方式——我们不是在脑中”逐字默念”来规划行动，而是在一个抽象的空间中”想象”结果。

LeCun实验中，小参数+单张GPU就实现了：

过去三年，LLM路线一骑绝尘，JEPA的声音被淹没在Scaling Law的狂欢中。但2026年出现了一些转折点：

LLM路线：
输入文本 → 分词 → Transformer层层计算 → 逐token生成输出 → 解码为文本
        ↑ 计算密集，每一步都昂贵

JEPA路线：
输入感知 → 编码器提取嵌入 → 在嵌入空间预测/规划 → 解码器输出
        ↑ 在抽象空间操作，计算量大幅降低

LeCun赌的是**“全行业在一条路上卷到头，而另一条路可能更好”**。这个赌注是否正确，2026-2027年会有更多答案。但有一点可以肯定：AI路线之争远未结束。