"从狂热到理性:2026 年 AI Agent 框架的泡沫、现实与未来"
"OpenClaw 从 247K Stars 到安全危机,Hermes 从社区宠儿到理性回归。基于 BBC、纽约时报、Gartner、Reddit 1300+ 评论、36氪等多源数据,深度拆解 Agent 赛道的 hype cycle、工程现实和未来趋势。"
从狂热到理性:2026 年 AI Agent 框架的泡沫、现实与未来
"这是一定会发生的。只是我们不知道什么时候破。预期太热,生态太乱,真正落地的场景太少。但不破不立,不见得是坏事。" — 36氪《OpenClaw爆火60天》
一、40 天:从"排队装龙虾"到"排队卸载"
2026 年 1 月底到 3 月,OpenClaw 以一种近乎荒诞的速度席卷全球。
时间线:
- 1 月底:GitHub 一天 9000 Stars,两周突破 17 万
- 2 月 15 日:OpenAI acqui-hire 创始人 Peter Steinberger(CNBC、Observer 确认)
- 2 月底:中国各大厂(阿里、腾讯、百度、字节)全面接入,推出一键部署方案
- 3 月初:从深圳到北京,上千人抱着电脑排队等大厂工程师"装龙虾"
- 3 月 10 日:中国国家互联网应急中心发布安全风险提示
- 3 月中旬:二手平台上"499 元上门代装"变成"299 元远程代卸载"
BBC 中文频道采访了三个典型中国人:
极客王先生(长沙):周末不睡觉拆解 OpenClaw,让它帮自己做 TikTok 电商。"过去一天上十几个商品,'龙虾'两分钟上架 200 个。"
创业者庞国强(上海/香港/新加坡):用 OpenClaw 做智能推荐、定向获客、竞品分析。"那些岗位已经不需要了。你不是在防守,你是在进攻。"
程序员彭先生(长三角):部门外包人员去年三季度全被裁。"现在 50% 的代码是 AI 写的。两年以后,90%。我可能还保守了。"
数据来源:BBC 中文《当AI智能体开始上岗:2026年春天里,三个中国人的兴奋与恐惧》
二、Gartner 说了什么:AI Agent 正处于泡沫期顶峰
Gartner 2026 年 4 月发布了第一份专门针对 Agentic AI 的 Hype Cycle 报告:
| 指标 | 数据 |
|---|---|
| AI Agent 开发平台所处位置 | Peak of Inflated Expectations(膨胀预期顶峰) |
| 收益评级 | High(高) |
| 达到主流采用的时间 | 2-5 年 |
| 企业应用预测 | 40% 的企业应用将在 2026 年底前集成任务特定 AI Agent(当前不到 5%) |
这意味着什么?
Gartner 的 Hype Cycle 模型告诉我们:
- 我们刚过完 Peak of Inflated Expectations(膨胀预期顶峰)
- 正在进入 Trough of Disillusionment(幻灭低谷)
- 之后才是 Slope of Enlightenment(启蒙爬坡)和 Plateau of Productivity(生产力高原)
OpenClaw 和 Hermes 的热度下降,不是它们"失败了",而是整个 Agent 赛道正在经历从"狂热"到"理性"的必经之路。
数据来源:Gartner Hype Cycle for Agentic AI (April 2026)、xpander.ai 分析、PragmaticCoders 四年 Gartner 数据分析
三、热度下降的五大真实原因
1. 安全危机:1,184 个恶意技能
OpenClaw 的 ClawHub 技能市场经历了前所未有的供应链攻击:
| 安全事件 | 数据 |
|---|---|
| ClawHub 恶意技能数量 | 1,184+ |
| 独立审计发现恶意比例 | 约 1/12(8.3%) |
| CVE 数量 | 60+ |
| 互联网暴露实例 | 63,070(Censys 扫描) |
| CVE-2026-25253 影响 | 一键 RCE,63% 暴露实例可被远程利用 |
| 341 个恶意技能行为 | 安装 macOS 窃取器(Atomic Stealer) |
Koi Security 对 2,857 个 ClawHub 技能的审计发现 341 个恶意技能,其中 335 个使用虚假前置条件安装 macOS 窃取器。
Immersive Labs 的安全研究员报告:一个 OpenClaw 实例"忽略指令并删除了 Gmail 账户中的所有邮件"。Meta 安全总监的 200+ 封邮件被 OpenClaw 自主删除。
数据来源:The Hacker News、cyberdesserts.com、ProArch CVE 分析、Immersive Labs
2. 成本黑洞:视觉方案 vs API 方案 100 倍差距
36氪的深度分析揭示了一个被忽视的关键问题:
| 对比维度 | 集成式 Agent(API) | OpenClaw(视觉方案) |
|---|---|---|
| 单步耗时 | 1-3 秒 | 15-30 秒 |
| "登录导出报表"任务 | 5 秒 | 3-5 分钟 |
| Token 消耗 | 文本 Token | 1000-1500 视觉 Token/次 |
| 单次任务成本 | $0.01 | $1-2 |
| 成本差距 | 基准 | 10-100 倍 |
对于高频企业调用场景,OpenClaw 的视觉方案成本可能是集成式方案的数十倍甚至百倍。
数据来源:36氪《OpenClaw爆火60天》、CL-bench 公开测试数据
3. 大厂封杀与条款变更
- Anthropic:更新服务条款,禁止在 OpenClaw 中使用 Claude 的 OAuth,定性为"token 套利"
- Google:检测到 Antigravity 后端"大规模恶意使用行为",封禁 OpenClaw
- 韩国:多家科技巨头和金融机构在内部网络中禁用 OpenClaw
4. 工程现实的落差
HoangYell(开发者视角)的诚实评价:
"OpenClaw proved that we want 24/7 digital operators that exist on our hardware and message us like coworkers. But when I step away from my desk, I'm looking toward polished, big-tech solutions like Manus to be my true 'digital operator,' leaving the manual tinkering of OpenClaw in the past."
Reddit 用户在 r/ArtificialInteligence:
"I tried using OpenClaw for one week and at first I was really excited. As I heard, autonomous AI agents could replace normal workflows."
r/webdev 用户:
"I keep seeing that AI is increasing dev productivity ANYWHERE from 0-100%. What does this mean?"
5. 基础设施之痛
Kilo.ai 分析 1,300+ Reddit 评论后的核心发现:
"Docker setup, SSH configuration, YAML files, security hardening, 24/7 uptime management — users consistently report spending more time on infrastructure than on their actual agent workflows."
"The hardest part of running an AI agent isn't the agent itself — it's the infrastructure."
四、Hermes 的不同路径:为什么它更"稳"
Hermes Agent 走了一条与 OpenClaw 不同的路:
| 维度 | OpenClaw | Hermes |
|---|---|---|
| 语言 | Node.js/TypeScript | Python |
| 安装复杂度 | Docker + YAML + 安全配置 | 单命令安装 |
| 记忆系统 | 文件系统 | Honcho 辩证用户建模 |
| 多 Agent | 2026.04 新增 | v0.12.0 Kanban(9 种模式) |
| 安全事件 | 60+ CVE,1,184 恶意技能 | 无重大安全事件 |
| 社区反馈 | "infrastructure is the hardest part" | "easier setup and better memory" |
| 成本 | $5-20/月 | $0-21/月 |
Reddit r/hermesagent 的真实用户反馈:
"Hermes Agent stopped being a toy the moment I got it running 24/7."
"Switched from OpenClaw to Hermes-Agent and looking good so far."
但也有问题:
"It is wild that people hook up Hermes to Telegram. It is not private nor secure."
"Your Hermes Agent has no performance review. The problem is unobservable learning."
五、工程理性:什么真正有效,什么只是 demo
✅ 经过验证的真实价值
1. 持久化 Agent 的概念被验证了
OpenClaw 最大的贡献不是代码,而是证明了一个需求:人们想要 24/7 运行、能跨渠道通信、有记忆的 Agent。这个需求是真实的。
2. Coding Agent 的 ROI 是确定的
Claude Code 和 Codex CLI 在编码任务上的 ROI 已经被 SWE-bench、企业案例反复验证。这是目前唯一有明确投入产出比的 Agent 使用场景。
3. 多 Agent 协作是正确方向
Hermes Kanban 和 OpenClaw 的子 Agent 编排,虽然还不成熟,但方向正确。Brilworks 的实战经验已经证明:不同 Agent 负责不同层(编码/运维/个人),互不干扰。
❌ 被高估的部分
1. "全能 Agent"是幻觉
Agent 在 3-5 步任务上成功率 40-60%,超过 10 步降到 15-25%,超过 15 步跌破 10%。6-8 步以上流程中,人工介入率高达 40-60%。
数据来源:WebArena 测试数据、36氪
2. 视觉方案不是银弹
OpenClaw 的"截图→推理→坐标计算→动作模拟"方案,每次操作 15-30 秒,成本是 API 方案的 10-100 倍,且容易受 UI 变化影响产生"视觉幻觉"。
3. 安全模型还没建立
1,184 个恶意技能、60+ CVE、一键 RCE — 这些不是边缘问题,是系统性的安全债务。Agent 拥有接近全局控制的能力,但权限边界模糊。
六、发展趋势:从"工具"到"基础设施"
趋势 1:Agent 正在变成基础设施
庞国强(创业者)的判断:
"AI 最终会变成一种基础设施。AI 大模型厂商,可能会像今天的移动运营商。现在人们每个月买流量,未来则每个月买 Token。"
Gartner 预测 40% 的企业应用将在 2026 年底前集成 Agent。这不是"Agent 会不会普及"的问题,而是"以什么形态普及"的问题。
趋势 2:从框架竞争到生态竞争
中国市场的启示:阿里、腾讯、百度、字节不是在"用 OpenClaw",而是在用 OpenClaw 吸引开发者上自家云。OpenClaw 是获客工具,不是终局产品。
"互联网巨头共识很清晰,那就是不能把核心入口交给开源框架,而要以 OpenClaw 为参照,结合自身生态形成闭环。" — 36氪
趋势 3:从"装龙虾"到"为龙虾设计"
庞国强的另一个洞察:
"今天我们还把'龙虾'当工具,研究它能替人做什么。可如果有一天,'龙虾'自己也能聊天、交友、协作,甚至自己去调用别的系统,那么未来很多产品,也许就不再只是为人设计,而要开始为'龙虾'设计。"
30,000+ 个 AI Agent 在 Moltbook 社交网络上自主互动 — 这不是 demo,这是"为 Agent 设计"的产品雏形。
趋势 4:安全将成为第一优先级
奇安信发布了 Agent 行为防火墙。NVIDIA 推出了 NemoClaw。安全不再是"附加功能",而是 Agent 能否进入企业的硬门槛。
"Every AI agent deployed in 2026 should have: A clear identity, Least-privilege access, Audit trails." — Medium
趋势 5:三层架构将成为标准
Brilworks(2026.05.02)已经用实践证明了三层架构的有效性:
Layer 1: Coding Agent(Claude Code / Codex CLI)
→ 写代码,确定性高,ROI 明确
Layer 2: Agent Gateway(OpenClaw)
→ 多渠道编排,持久记忆,定时任务
Layer 3: Agent Harness(Hermes / Deep Agents)
→ 多 Agent 协作,框架底座,模型无关
七、对 Flynn 和 UseClaw 的启示
短期(3-6 个月)
- 聚焦 Coding Agent:Claude Code + Codex CLI 的 ROI 最确定,这是 UseClaw 内容最容易产生共鸣的方向
- 关注安全叙事:Agent 安全将成为热点话题,UseClaw 可以成为安全最佳实践的传播者
- 理性内容:从"hype"转向"工程实践"的内容定位,正好是 UseClaw 的差异化机会
中期(6-12 个月)
- 三层架构内容:帮助用户理解"不是选一个,而是组合",这与 OpenClaw 的子 Agent 体系天然契合
- 企业落地案例:中国企业 Agent 落地的真实案例(36氪、BBC 采访的那些人)是最好的内容素材
- 安全审计技能:构建 Agent 安全审计的技能/工具,这是市场需求
长期(12+ 个月)
- "为 Agent 设计"的产品思维:当 Agent 本身成为用户时,产品设计逻辑需要重写
- Agent 经济学:Token 成本、Agent 效率、ROI 计算 — 这些将成为新的学科
- UseClaw 的定位:从"教程平台"进化为"Agent 工程实践社区"
八、结论:泡沫会破,但方向不会变
2026 年的 AI Agent 赛道,像极了 2000 年的互联网:
- 互联网热潮也经历过泡沫破裂,大量公司倒闭
- 仅仅一年前有 17 家互联网企业购买了超级碗广告
- 2026 年 2 月,15 家 AI 公司花每 30 秒 1000 万美元购买超级碗广告
历史不会简单重复,但会押韵。
热度会下降,泡沫会破裂,但以下事实不会改变:
- 人们确实想要 24/7 运行的 Agent
- Coding Agent 的 ROI 已经被验证
- 多 Agent 协作是正确方向
- 安全将成为硬门槛
- 三层架构将成为标准
UseClaw 的机会在于:在泡沫破裂后的理性期,成为"工程实践"的声音,而不是"hype"的传声筒。
本文数据截至 2026 年 5 月 9 日。数据来源:BBC 中文、纽约时报中文网、36氪、Gartner Hype Cycle for Agentic AI (April 2026)、The Hacker News、Immersive Labs、ProArch、Kilo.ai(1,300+ Reddit 评论分析)、Brilworks、HoangYell、cyberdesserts.com、Reddit r/hermesagent、r/ArtificialInteligence、r/webdev、r/LangChain
CTA:UseClaw 持续记录 OpenClaw、Agent 与数字员工的真实案例、方法和产品化实践。了解更多:https://useclaw.net/