"Karpathy 最新演讲:从 Vibe Coding 到 Agentic Engineering,程序员的下一个十年"
"OpenAI 联合创始人、前特斯拉 AI 负责人 Andrej Karpathy 在红杉资本 AI Ascent 2026 上的最新分享:为什么他从未觉得自己更落后过,什么是 Agentic Engineering,以及为什么 LLM 不是动物而是幽灵。"
Karpathy 最新演讲:从 Vibe Coding 到 Agentic Engineering,程序员的下一个十年
"你可以外包你的思考,但你无法外包你的理解。" —— Andrej Karpathy
如果你只记住了 Karpathy 的一句话,应该是这句。
2026 年 4 月,红杉资本 AI Ascent 大会上,OpenAI 联合创始人、前特斯拉 AI 负责人 Andrej Karpathy 和红杉合伙人 Stephanie Zhan 进行了一场深度对话。距离他发明"Vibe Coding"这个词才过去一年,但他已经走得更远了——他现在谈论的是 Agentic Engineering。
这场对话信息密度极高,我帮你提炼出最核心的洞察。
一、"我从未觉得自己更落后过"
这句话从 Karpathy 嘴里说出来,分量不轻。
他的转折点在 2025 年 12 月。之前用 AI 编程工具,写出来的代码块经常需要修改,还得人工兜底。但到了 12 月,他突然发现:代码块直接就是对的,他想不起来上一次修正是什么时候了。
"我开始信任这个系统,然后我就在 Vibe Coding 了。"
他强调,很多人对 AI 的认知还停留在 ChatGPT 时代——你必须在 2025 年 12 月之后重新审视,因为质变已经发生了,尤其是在 agentic 的连贯工作流上。
二、Software 3.0:你不再写代码,你写的是"给 Agent 的指令"
Karpathy 把软件演进分为三个时代:
- Software 1.0:写代码(if/else、循环、函数)
- Software 2.0:写数据集,训练神经网络(编程变成了"调数据+调架构")
- Software 3.0:写 prompt,上下文窗口就是你的编程接口
他举了一个让人拍案的例子:
OpenClaw 的安装方式。 传统的安装应该是一个 bash 脚本,要适配各种平台变得极其复杂。但 OpenClaw 的安装方式是——一段文本,复制粘贴给你的 Agent。Agent 有自己的智能,它会看你的环境、你的系统,自己搞定安装和调试。
"这就是 Software 3.0 的编程范式:你要想的是'给 Agent 复制粘贴什么文本'。"
更极端的例子是他的 Menu Gen 项目。他花了很多时间写一个 App:拍菜单照片 → OCR 识别 → 图片生成器生成菜品图片 → 展示。结果他发现,用 Gemini 直接把照片扔给它说"把菜品图片叠加到菜单上",一步到位,整个 App 都不需要存在。
"我的 Menu Gen 是用旧范式做的,那个 App 不应该存在。"
三、Vibe Coding vs Agentic Engineering:两件完全不同的事
这是整场对话最关键的区分:
Vibe Coding = 降低门槛。每个人都能 Vibe Coding,天花板抬高了,这是好事。
Agentic Engineering = 保持质量。你不允许因为 Vibe Coding 而引入安全漏洞。你仍然对软件质量负责,但你能更快。
"Vibe Coding 是抬地板,Agentic Engineering 是保天花板。"
Karpathy 认为 Agentic Engineering 是一个真正的工程学科。Agent 是"尖锐的实体"——能力很强但有点脆弱、有点随机。如何协调它们在不牺牲质量的前提下加速?这是 Agentic Engineering 要回答的问题。
他的判断:以前说 10x 工程师,现在远不止 10x。 精通 Agentic Engineering 的人,生产力提升是数量级的。
四、LLM 不是动物,是幽灵
Karpathy 写过一篇广为流传的文章,说我们应该把 LLM 想象成**幽灵(Ghost)**而不是动物。
动物有进化塑造的内在动机、好奇心、求生本能。LLM 没有这些。它们是被"召唤"出来的统计实体——底层是预训练的统计规律,上面叠加了强化学习。
"你对它们喊叫不会有任何效果。"
这个框架为什么重要?因为它帮你建立正确的使用心智模型:
- 不要期待 LLM 有"常识"——它只有训练数据覆盖到的领域
- 不要假设它在所有领域都强——它是锯齿状的(Jagged)
- 你需要保持在回路中,因为它在某些地方强得惊人,在另一些地方蠢得离谱
关于"锯齿状智能"的经典例子
"Opus 4.7 能重构 10 万行代码库、能找到零日漏洞,但同时它会告诉你 50 米外的洗车店应该走着去。"
这怎么可能?答案是:模型的能力高度依赖训练数据中的强化学习覆盖范围。 在 RL 覆盖的电路里,它飞速前进;在 RL 没覆盖的电路里,它原地打转。
Karpathy 的建议:你必须亲自探索这个没有说明书的工具,搞清楚你的应用在哪些电路上,如果不在,就得自己做微调。
五、可验证性决定自动化的速度
Karpathy 的核心框架:AI 会更快、更容易地自动化那些输出可以被验证的领域。
- 数学、代码——输出可以验证,所以被自动化得最快
- 棋类——GPT-3.5 到 GPT-4 棋力大幅提升,不是因为"自然进步",而是有人把大量棋类数据塞进了预训练集
对创业者的启示:如果你在一个可验证的领域,即使大厂没关注到,你也可以自己做微调,因为强化学习的技术本身是通用的——只要你有足够多样的 RL 环境和数据集。
六、什么变得更有价值?
当 Agent 做更多事的时候,什么人类技能反而更值钱?
品味、判断力、审美。
Karpathy 举了一个生动的例子:他的 Menu Gen 项目用 Google 账号登录,用 Stripe 账号付费,两个都有邮箱地址。Agent 居然尝试用邮箱地址来关联用户——但如果用户用了不同的邮箱呢?
"这种事 Agent 还是会搞错。为什么你会用邮箱地址来交叉关联资金?这太蠢了。"
你必须负责设计规范(Spec)。 不是 Plan Mode,而是更根本的东西——你和 Agent 一起设计一个详细的规范文档,然后让 Agent 去实现。你在顶层做监督和分类判断,Agent 在底层填充细节。
"你不需要记住 keepdims 还是 keep_dim,但你必须知道底层有一个张量、有一个视图、有共享存储和独立存储的区别。API 细节交给 Agent,基本原理留在你脑子里。"
七、招聘应该彻底改变
Karpathy 认为大多数公司的招聘流程还停留在旧范式——给候选人出编程题。
他的建议:
"给我一个真正的大项目。比如让候选人用 10 个 Codex 5.4 实例写一个 Twitter 克隆,然后让 Agent 模拟用户活动,再让其他 Agent 尝试攻破这个网站。看它能不能被攻破。"
这才是 Agentic Engineering 时代的面试方式。
八、可以外包思考,但不能外包理解
最后关于教育和学习,Karpathy 引用了一条让他"每隔一天都会想起来"的推文:
"你可以外包你的思考,但你无法外包你的理解。"
信息仍然需要进入你的大脑。你仍然是系统的瓶颈——你要知道我们在构建什么、为什么值得做、如何指挥 Agent。
他用 LLM 知识库项目举例:每次看到信息的不同投影,他都能获得新的洞察。这些工具本质上是在增强理解,而理解仍然是不可替代的。
"LLM 在理解方面并不擅长。你仍然独一无二地负责这件事。"
我的总结:Karpathy 给我们的三个行动建议
-
重新审视你的工具链 — 如果你还在 2025 年之前的方式使用 AI 编程,你已经落后了。现在就去试试 Agentic 工作流。
-
投资你的"规范设计"能力 — 写 Spec 比写代码更重要。能把问题定义清楚、验收标准写清楚的人,在这个时代最值钱。
-
保持理解的深度 — 不要因为 AI 能做就跳过学习。基本原理、系统思维、架构直觉——这些是你的护城河。
本文基于 Andrej Karpathy 在红杉资本 AI Ascent 2026 的对话整理。原视频:YouTube
UseClaw 持续记录 OpenClaw、Agent 与数字员工的真实案例、方法和产品化实践。 了解更多:https://useclaw.net/