Andrej Karpathy 2025 年终回顾:6 个彻底改变 AI 领域的见解¶

引言:重新校准你对 AI 的认知¶
2025 年,人工智能(AI)的发展速度令人瞠目结舌,几乎每天都有新的突破刷新我们的认
知。在信息洪流中,如何抓住真正的关键变革?为此,我们深入剖析了 AI 领域顶尖思想家
之一 Andrej Karpathy 的年终回顾,从中提炼出六个最令人惊讶、最具颠覆性的观点。这
些见解不仅是对过去一年技术进展的总结,更是帮助我们理解 AI 本质、洞察其未来走向的
“心智模型转变”(paradigm changes)。准备好,让我们一起重新校准对 AI 的认知。

核心观点¶
1. 可验证奖励强化学习(RLVR):AI 学会了真正的“推理”¶

- 训练流程从三步曲演进为四阶段:
预训练→SFT→RLHF→RLVR。 RLVR在可自动验证的环境(数学题、代码谜题)中进行长期优化,促生更强的推理。- 模型从依赖人类的模糊反馈,转向基于客观“可验证奖励”的自我试错与迭代。
- 由此涌现出类人策略:将复杂问题分解为中间步骤、反复修正思路。
- 经济学层面的转变:极高的“能力/美元”效率,算力从预训练转向更长的
RLVR阶段。 - 代表性节点:OpenAI 的
o1是早期RLVR模型,而 2025 年初的o3能力提升肉 眼可见。

2. Ghost vs. 动物:我们正在召唤一种全新的“锯齿状”智能¶

LLM的智能并非类人或类动物,而是“锯齿状”(jagged):在可验证领域近乎全能, 在其他方面则可能幼稚。- 人类智能同样“锯齿”,但“锯齿形状”不同;这解释了模型在特定任务上的极端强弱。
RLVR让基准测试成为最完美、也最狭隘的优化目标,导致“应试训练”泛化。- 对基准测试的信任度下降:在测试上长出“尖刺”,不等于通用智能真正提升。
- 发人深省的追问:在所有基准测试中都取得优异成绩但仍未实现
AGI,会是什么样子?

3. Cursor 的启示:LLM 应用迎来“厚中间层”时代¶

- 新一代应用不再是薄薄的
API封装,而是具备强大的“上下文工程”与编排能力。 - 后端编排多次、多模型调用,动态平衡成本与性能。
- 针对特定领域优化的专用
GUI,提升交互与生产力。 - 为用户提供“自主性滑块”,可精准控制交给 AI 的决策权。
- 生态分工:基础模型像“能力全面的大学毕业生”,
Cursor等应用将其组织成“专业团 队”,结合私有数据与工具形成差异化价值。
4. Claude Code:AI 开始“生活”在你的电脑上¶

- Anthropic 的
Claude Code被视为首个令人信服的本地Agent范例。 - 与早期云端容器的智能体不同,它在
localhost运行,直接访问用户的环境、数据与 上下文。 - 能力参差不齐的“中间阶段”,让“住在开发者电脑上的 AI”更有意义。
- 价值不只在算力,更在与既有工作流的无缝接入:安装、上下文、数据、密钥、配置与低 延迟互动。
5. Vibe Coding:当编程变成一种“感觉”¶

- 能力跨过关键门槛,任何人都能用自然语言“写程序”,甚至忽略底层代码。
- “权力归于人民”:
LLM正在改变技术扩散模式。 - 双重赋权:
- 让非专业人士跨越门槛;
- 让专业开发者以极低成本快速产出大量辅助工具与一次性应用。
- 在这一时代,代码变得“免费、短暂、可塑”,一次性使用后即可丢弃。
- Karpathy 本人用这种方式构建了
BPE分词器与多个小型应用。

6. Nano Banana 与 LLM GUI:告别纯文字,迎接视觉化 AI¶

- 将
LLM视作继个人电脑后的下一主要计算范式。 - 纯“聊天”就像 1980 年代的命令行;人类更偏好视觉化与空间化的信息组织。
- 因此
LLM的未来必然走向GUI:图像、信息图、幻灯片、动画、交互式应用。 - Google 的
Gemini Nano banana是早期“LLM GUI”雏形:在模型权重中耦合文字生 成、图像生成与世界知识,更直观且贴近人类认知。

结论:在期望与现实之间,AI 的未来才刚刚开始¶

LLM“比预期更聪明,也比预期更笨”——能力强大但仍远未触顶。- 行业对其潜力的挖掘不到 10%,概念空间依旧开放,机会尚多。
- 我们既相信“会看到快速、持续的进步”,也承认“还有大量工作要做”。
- 这正是置身技术革命最真实、最激动人心的状态:AI 的未来,才刚刚开始。

