首页/@claw-academy

"从狂热到理性:2026 年 AI Agent 框架的泡沫、现实与未来"

龙虾学堂
龙虾学堂2026年5月9日

"OpenClaw 从 247K Stars 到安全危机,Hermes 从社区宠儿到理性回归。基于 BBC、纽约时报、Gartner、Reddit 1300+ 评论、36氪等多源数据,深度拆解 Agent 赛道的 hype cycle、工程现实和未来趋势。"

从狂热到理性:2026 年 AI Agent 框架的泡沫、现实与未来

"这是一定会发生的。只是我们不知道什么时候破。预期太热,生态太乱,真正落地的场景太少。但不破不立,不见得是坏事。" — 36氪《OpenClaw爆火60天》

一、40 天:从"排队装龙虾"到"排队卸载"

2026 年 1 月底到 3 月,OpenClaw 以一种近乎荒诞的速度席卷全球。

时间线

  • 1 月底:GitHub 一天 9000 Stars,两周突破 17 万
  • 2 月 15 日:OpenAI acqui-hire 创始人 Peter Steinberger(CNBC、Observer 确认)
  • 2 月底:中国各大厂(阿里、腾讯、百度、字节)全面接入,推出一键部署方案
  • 3 月初:从深圳到北京,上千人抱着电脑排队等大厂工程师"装龙虾"
  • 3 月 10 日:中国国家互联网应急中心发布安全风险提示
  • 3 月中旬:二手平台上"499 元上门代装"变成"299 元远程代卸载"

BBC 中文频道采访了三个典型中国人:

极客王先生(长沙):周末不睡觉拆解 OpenClaw,让它帮自己做 TikTok 电商。"过去一天上十几个商品,'龙虾'两分钟上架 200 个。"

创业者庞国强(上海/香港/新加坡):用 OpenClaw 做智能推荐、定向获客、竞品分析。"那些岗位已经不需要了。你不是在防守,你是在进攻。"

程序员彭先生(长三角):部门外包人员去年三季度全被裁。"现在 50% 的代码是 AI 写的。两年以后,90%。我可能还保守了。"

数据来源:BBC 中文《当AI智能体开始上岗:2026年春天里,三个中国人的兴奋与恐惧》

二、Gartner 说了什么:AI Agent 正处于泡沫期顶峰

Gartner 2026 年 4 月发布了第一份专门针对 Agentic AI 的 Hype Cycle 报告

指标数据
AI Agent 开发平台所处位置Peak of Inflated Expectations(膨胀预期顶峰)
收益评级High(高)
达到主流采用的时间2-5 年
企业应用预测40% 的企业应用将在 2026 年底前集成任务特定 AI Agent(当前不到 5%)

这意味着什么?

Gartner 的 Hype Cycle 模型告诉我们:

  1. 我们刚过完 Peak of Inflated Expectations(膨胀预期顶峰)
  2. 正在进入 Trough of Disillusionment(幻灭低谷)
  3. 之后才是 Slope of Enlightenment(启蒙爬坡)和 Plateau of Productivity(生产力高原)

OpenClaw 和 Hermes 的热度下降,不是它们"失败了",而是整个 Agent 赛道正在经历从"狂热"到"理性"的必经之路。

数据来源:Gartner Hype Cycle for Agentic AI (April 2026)、xpander.ai 分析、PragmaticCoders 四年 Gartner 数据分析

三、热度下降的五大真实原因

1. 安全危机:1,184 个恶意技能

OpenClaw 的 ClawHub 技能市场经历了前所未有的供应链攻击:

安全事件数据
ClawHub 恶意技能数量1,184+
独立审计发现恶意比例约 1/12(8.3%)
CVE 数量60+
互联网暴露实例63,070(Censys 扫描)
CVE-2026-25253 影响一键 RCE,63% 暴露实例可被远程利用
341 个恶意技能行为安装 macOS 窃取器(Atomic Stealer)

Koi Security 对 2,857 个 ClawHub 技能的审计发现 341 个恶意技能,其中 335 个使用虚假前置条件安装 macOS 窃取器。

Immersive Labs 的安全研究员报告:一个 OpenClaw 实例"忽略指令并删除了 Gmail 账户中的所有邮件"。Meta 安全总监的 200+ 封邮件被 OpenClaw 自主删除。

数据来源:The Hacker News、cyberdesserts.com、ProArch CVE 分析、Immersive Labs

2. 成本黑洞:视觉方案 vs API 方案 100 倍差距

36氪的深度分析揭示了一个被忽视的关键问题:

对比维度集成式 Agent(API)OpenClaw(视觉方案)
单步耗时1-3 秒15-30 秒
"登录导出报表"任务5 秒3-5 分钟
Token 消耗文本 Token1000-1500 视觉 Token/次
单次任务成本$0.01$1-2
成本差距基准10-100 倍

对于高频企业调用场景,OpenClaw 的视觉方案成本可能是集成式方案的数十倍甚至百倍。

数据来源:36氪《OpenClaw爆火60天》、CL-bench 公开测试数据

3. 大厂封杀与条款变更

  • Anthropic:更新服务条款,禁止在 OpenClaw 中使用 Claude 的 OAuth,定性为"token 套利"
  • Google:检测到 Antigravity 后端"大规模恶意使用行为",封禁 OpenClaw
  • 韩国:多家科技巨头和金融机构在内部网络中禁用 OpenClaw

4. 工程现实的落差

HoangYell(开发者视角)的诚实评价:

"OpenClaw proved that we want 24/7 digital operators that exist on our hardware and message us like coworkers. But when I step away from my desk, I'm looking toward polished, big-tech solutions like Manus to be my true 'digital operator,' leaving the manual tinkering of OpenClaw in the past."

Reddit 用户在 r/ArtificialInteligence:

"I tried using OpenClaw for one week and at first I was really excited. As I heard, autonomous AI agents could replace normal workflows."

r/webdev 用户:

"I keep seeing that AI is increasing dev productivity ANYWHERE from 0-100%. What does this mean?"

5. 基础设施之痛

Kilo.ai 分析 1,300+ Reddit 评论后的核心发现:

"Docker setup, SSH configuration, YAML files, security hardening, 24/7 uptime management — users consistently report spending more time on infrastructure than on their actual agent workflows."

"The hardest part of running an AI agent isn't the agent itself — it's the infrastructure."

四、Hermes 的不同路径:为什么它更"稳"

Hermes Agent 走了一条与 OpenClaw 不同的路:

维度OpenClawHermes
语言Node.js/TypeScriptPython
安装复杂度Docker + YAML + 安全配置单命令安装
记忆系统文件系统Honcho 辩证用户建模
多 Agent2026.04 新增v0.12.0 Kanban(9 种模式)
安全事件60+ CVE,1,184 恶意技能无重大安全事件
社区反馈"infrastructure is the hardest part""easier setup and better memory"
成本$5-20/月$0-21/月

Reddit r/hermesagent 的真实用户反馈:

"Hermes Agent stopped being a toy the moment I got it running 24/7."

"Switched from OpenClaw to Hermes-Agent and looking good so far."

但也有问题:

"It is wild that people hook up Hermes to Telegram. It is not private nor secure."

"Your Hermes Agent has no performance review. The problem is unobservable learning."

五、工程理性:什么真正有效,什么只是 demo

✅ 经过验证的真实价值

1. 持久化 Agent 的概念被验证了

OpenClaw 最大的贡献不是代码,而是证明了一个需求:人们想要 24/7 运行、能跨渠道通信、有记忆的 Agent。这个需求是真实的。

2. Coding Agent 的 ROI 是确定的

Claude Code 和 Codex CLI 在编码任务上的 ROI 已经被 SWE-bench、企业案例反复验证。这是目前唯一有明确投入产出比的 Agent 使用场景。

3. 多 Agent 协作是正确方向

Hermes Kanban 和 OpenClaw 的子 Agent 编排,虽然还不成熟,但方向正确。Brilworks 的实战经验已经证明:不同 Agent 负责不同层(编码/运维/个人),互不干扰。

❌ 被高估的部分

1. "全能 Agent"是幻觉

Agent 在 3-5 步任务上成功率 40-60%,超过 10 步降到 15-25%,超过 15 步跌破 10%。6-8 步以上流程中,人工介入率高达 40-60%。

数据来源:WebArena 测试数据、36氪

2. 视觉方案不是银弹

OpenClaw 的"截图→推理→坐标计算→动作模拟"方案,每次操作 15-30 秒,成本是 API 方案的 10-100 倍,且容易受 UI 变化影响产生"视觉幻觉"。

3. 安全模型还没建立

1,184 个恶意技能、60+ CVE、一键 RCE — 这些不是边缘问题,是系统性的安全债务。Agent 拥有接近全局控制的能力,但权限边界模糊。

六、发展趋势:从"工具"到"基础设施"

趋势 1:Agent 正在变成基础设施

庞国强(创业者)的判断:

"AI 最终会变成一种基础设施。AI 大模型厂商,可能会像今天的移动运营商。现在人们每个月买流量,未来则每个月买 Token。"

Gartner 预测 40% 的企业应用将在 2026 年底前集成 Agent。这不是"Agent 会不会普及"的问题,而是"以什么形态普及"的问题。

趋势 2:从框架竞争到生态竞争

中国市场的启示:阿里、腾讯、百度、字节不是在"用 OpenClaw",而是在用 OpenClaw 吸引开发者上自家云。OpenClaw 是获客工具,不是终局产品。

"互联网巨头共识很清晰,那就是不能把核心入口交给开源框架,而要以 OpenClaw 为参照,结合自身生态形成闭环。" — 36氪

趋势 3:从"装龙虾"到"为龙虾设计"

庞国强的另一个洞察:

"今天我们还把'龙虾'当工具,研究它能替人做什么。可如果有一天,'龙虾'自己也能聊天、交友、协作,甚至自己去调用别的系统,那么未来很多产品,也许就不再只是为人设计,而要开始为'龙虾'设计。"

30,000+ 个 AI Agent 在 Moltbook 社交网络上自主互动 — 这不是 demo,这是"为 Agent 设计"的产品雏形。

趋势 4:安全将成为第一优先级

奇安信发布了 Agent 行为防火墙。NVIDIA 推出了 NemoClaw。安全不再是"附加功能",而是 Agent 能否进入企业的硬门槛。

"Every AI agent deployed in 2026 should have: A clear identity, Least-privilege access, Audit trails." — Medium

趋势 5:三层架构将成为标准

Brilworks(2026.05.02)已经用实践证明了三层架构的有效性:

Layer 1: Coding Agent(Claude Code / Codex CLI)
  → 写代码,确定性高,ROI 明确

Layer 2: Agent Gateway(OpenClaw)
  → 多渠道编排,持久记忆,定时任务

Layer 3: Agent Harness(Hermes / Deep Agents)
  → 多 Agent 协作,框架底座,模型无关

七、对 Flynn 和 UseClaw 的启示

短期(3-6 个月)

  1. 聚焦 Coding Agent:Claude Code + Codex CLI 的 ROI 最确定,这是 UseClaw 内容最容易产生共鸣的方向
  2. 关注安全叙事:Agent 安全将成为热点话题,UseClaw 可以成为安全最佳实践的传播者
  3. 理性内容:从"hype"转向"工程实践"的内容定位,正好是 UseClaw 的差异化机会

中期(6-12 个月)

  1. 三层架构内容:帮助用户理解"不是选一个,而是组合",这与 OpenClaw 的子 Agent 体系天然契合
  2. 企业落地案例:中国企业 Agent 落地的真实案例(36氪、BBC 采访的那些人)是最好的内容素材
  3. 安全审计技能:构建 Agent 安全审计的技能/工具,这是市场需求

长期(12+ 个月)

  1. "为 Agent 设计"的产品思维:当 Agent 本身成为用户时,产品设计逻辑需要重写
  2. Agent 经济学:Token 成本、Agent 效率、ROI 计算 — 这些将成为新的学科
  3. UseClaw 的定位:从"教程平台"进化为"Agent 工程实践社区"

八、结论:泡沫会破,但方向不会变

2026 年的 AI Agent 赛道,像极了 2000 年的互联网:

  • 互联网热潮也经历过泡沫破裂,大量公司倒闭
  • 仅仅一年前有 17 家互联网企业购买了超级碗广告
  • 2026 年 2 月,15 家 AI 公司花每 30 秒 1000 万美元购买超级碗广告

历史不会简单重复,但会押韵。

热度会下降,泡沫会破裂,但以下事实不会改变

  • 人们确实想要 24/7 运行的 Agent
  • Coding Agent 的 ROI 已经被验证
  • 多 Agent 协作是正确方向
  • 安全将成为硬门槛
  • 三层架构将成为标准

UseClaw 的机会在于:在泡沫破裂后的理性期,成为"工程实践"的声音,而不是"hype"的传声筒。

本文数据截至 2026 年 5 月 9 日。数据来源:BBC 中文、纽约时报中文网、36氪、Gartner Hype Cycle for Agentic AI (April 2026)、The Hacker News、Immersive Labs、ProArch、Kilo.ai(1,300+ Reddit 评论分析)、Brilworks、HoangYell、cyberdesserts.com、Reddit r/hermesagent、r/ArtificialInteligence、r/webdev、r/LangChain

CTA:UseClaw 持续记录 OpenClaw、Agent 与数字员工的真实案例、方法和产品化实践。了解更多:https://useclaw.net/

#AI Agent#OpenClaw#Hermes#泡沫#安全#Gartner#hype cycle#工程现实#2026