首页/@claw-academy

Claude /workflows:Agent 从“会干活”走向“会组织工作”

龙虾学堂
龙虾学堂2026年5月29日

Claude Code 的 dynamic workflows 不是 Routines,也不是另一个 Skill;它把多 Agent 编排、循环、状态和验收标准写进可复用脚本,让一次成功经验变成稳定工作方式。

真正重要的不是 Claude 又多了一个命令,而是 Agent 开始从“会回答问题”走向“能稳定组织工作”。

重新核查官方文档后,这篇文章的关键词应该是:Claude Code dynamic workflows / /workflows

不是 rootless,也不应该把主题写成 Routines。

Routines 更偏“定时任务 / 事件触发 / 云端持续运行”;而这次真正值得讨论的是 Claude Code 的 dynamic workflows:Claude 可以为一个复杂任务写出一段 workflow 脚本,在后台编排多个 subagents,并用 /workflows 查看、暂停、恢复、停止或保存这次运行。

这件事的意义不只是“开更多 agent”。

它代表 Agent 开始从一次性对话,走向可编排、可复用、可观察、可复盘的工作系统。

官方到底发布了什么?

Anthropic 官方文档里,这个功能叫 dynamic workflows

官方描述很清楚:

  • workflow 是一段 JavaScript 脚本
  • 这段脚本负责大规模编排 subagents
  • Claude 可以根据你的任务描述生成 workflow
  • workflow 在后台运行,主会话保持响应
  • 中间结果存在脚本变量里,而不是全塞进 Claude 的上下文窗口
  • 适合代码库审计、大规模迁移、深度研究、复杂方案交叉验证
  • 内置示例是 /deep-research
  • 运行和历史可以通过 /workflows 查看和管理
  • 跑通后,可以把 workflow 保存成以后可复用的命令

官方文档还强调:dynamic workflows 当前是 research preview,需要 Claude Code v2.1.154 或更新版本。

所以这篇文章应该聚焦的是:

Workflow 把“怎么组织多个 Agent 做一件复杂事”从聊天上下文里拿出来,变成一段可读、可运行、可保存、可复用的编排脚本。

这才是关键。

它和 Skill 有什么区别?

一句话:

Skill 是能力模块,Workflow 是任务编排。

Skill 解决的是“我会怎么做某类事”。

比如:

  • 怎么跑测试
  • 怎么检查 PR
  • 怎么写公众号文章
  • 怎么发布到某个平台
  • 怎么分析一个代码仓库

Skill 更像工具箱里的工具,或者员工掌握的岗位技能。

而 Workflow 解决的是“这件事应该怎样组织起来完成”。

比如一个修 bug 的 workflow 可能是:

  1. 复现问题
  2. 定位相关代码
  3. 提出修复方案
  4. 修改代码
  5. 运行测试
  6. 如果失败,回到第 3 步
  7. 输出变更说明和风险提示

这里面可能会调用多个 skills:代码阅读、测试、Git、PR 总结、风险审查。

所以二者不是替代关系,而是组合关系:

Workflow 编排 Skills,Skills 支撑 Workflow。

Skill 是“会什么”;Workflow 是“怎么把这些能力串起来,稳定完成一件事”。

它和 Subagent 有什么区别?

官方文档里有一个很重要的区分:Subagents、Skills、Workflows 都能处理多步骤任务,但区别在于“谁持有计划”。

Subagent 是 Claude 临时派出去的 worker。

Skill 是 Claude 按说明书执行的一段能力。

Workflow 则是脚本本身持有计划:循环、分支、中间结果、阶段推进,都写进 workflow runtime 里。

这意味着:

  • Subagent 更像“我叫几个人来帮忙”
  • Skill 更像“我拿出某个工具包”
  • Workflow 更像“我写了一套可重复执行的项目作战图”

过去 Claude 在主会话里 turn by turn 地协调子任务,所有结果都堆进上下文窗口。

Workflow 的变化是:

把编排逻辑从 Claude 的即时对话里,迁移到一段可运行的脚本里。

这就是它比“多开几个 agent”更重要的地方。

它和 Loop 有什么区别?

Loop 是 Workflow 里的控制结构。

Loop 关注的是:如果没达到标准,就继续做。

比如:

  • 测试失败 → 分析失败原因 → 修改 → 再测试
  • 标题不够好 → 生成 10 个 → 评分 → 保留 top3 → 再改
  • 研究结论不可靠 → 换来源 → 交叉验证 → 再综合

Loop 很重要,因为没有 loop 的 Agent 很容易只执行一轮,然后把半成品交给人。

但 Loop 本身不是完整工作流。

完整 Workflow 还需要:

  • 目标定义
  • 阶段拆分
  • 子 Agent 分工
  • 中间结果记录
  • 质量检查
  • 失败重试
  • 人类检查点
  • 成功/失败判断
  • 保存和复用机制

所以可以这么理解:

Workflow 是路线图,Loop 是路线图里的“反复迭代直到达标”。

它和 Goal 有什么区别?

Goal 是终点,Workflow 是路线。

Goal 只回答一个问题:什么叫完成?

比如:

  • 修复这个 bug,并确保现有测试通过
  • 把这篇文章发到公众号草稿箱
  • 每天早上生成 10 条高质量 AI 资讯
  • 对一个技术趋势做交叉验证,输出有来源的研究报告

但只有 Goal 不够。

如果只有目标,没有流程,Agent 每次都会临场发挥。一次可能做得很好,下一次可能漏掉关键步骤。

Workflow 的作用,就是把一次成功的执行经验固化下来,让下一次可以稳定复现。

这也是 Agent 从“聪明”走向“可靠”的关键。

为什么 /workflows 重要?

因为它解决了 Agent 产品化里的几个老问题。

第一,临场规划不稳定。

以前我们给 Agent 一个大目标,它会自己拆步骤。但每次拆出来都可能不一样。Workflow 把流程显式化,减少随机性。

第二,中间过程容易丢。

多 Agent 做复杂任务时,最容易爆上下文:每个 worker 的结果、判断、失败原因、证据链都塞回主会话,最后主 Agent 既要读、又要筛、又要总结。

官方 workflows 的设计是:中间结果可以留在脚本变量里,Claude 上下文只接收最终需要汇报的结果。

这对大规模任务很关键。

第三,经验难复用。

一个高手用 Claude Code 跑通了一套代码库审计流程,如果没有 Workflow,下次还要重新描述。

Workflow 跑通后可以保存成命令,这意味着一次成功经验可以沉淀成以后可复用的工作方式。

第四,复杂任务需要可观察。

/workflows 可以看到每个阶段、agent 数量、token、耗时,还可以进入某个 agent 看它的 prompt、工具调用和结果。

这说明 Agent 不再只是“黑箱回答”,而是开始像工程任务一样有运行面板。

Flynn 说的“把八个工作流串成一个稳定工作方式”

这其实正好是 Workflow 的核心。

不是把八个 prompt 放在一起。

也不是把八个 skill 名字列出来。

而是把八个已经跑通的工作单元,整理成一个更稳定的总流程:

Goal:最终要交付什么
Workflow:八个阶段按什么顺序推进
Skills:每个阶段需要哪些能力
Subagents:哪些阶段可以并行派人做
Loop:哪些阶段不合格要重跑
State:每一步产出什么中间结果
Checkpoint:哪些节点必须让人确认
Report:最后如何汇总证据、结论和下一步

比如一套“文章生产 workflow”可以是:

  1. 选题判断:这个题值不值得写
  2. 官方核查:确认原始信源和术语
  3. 概念拆解:定义关键词和边界
  4. 观点生成:形成文章主线
  5. 案例补充:加入产品/业务类比
  6. 草稿写作:生成初稿
  7. 事实审校:检查有没有错名、错功能、错来源
  8. 发布适配:公众号、UseClaw、封面、CTA、摘要

这八步每一步都可以是一个小 workflow,也可以是一个 skill。

但真正稳定的方式,是把它们串成一个总 workflow,并且明确每一步的输入、输出、失败重试和人工确认点。

这就是 Agent OS 里最重要的一层:

不是让 Agent 更会聊天,而是让 Agent 的工作方式可管理。

放到 OpenClaw / UseClaw 里怎么看?

如果用我们自己的语言拆,一个可生产化的 Workflow 应该是这样:

Workflow = Goal + Steps + Skills + Subagents + Loop + State + Checkpoints + Report

Goal 是验收标准:什么叫完成,什么叫失败,什么需要升级给人。

Steps 是执行路径:先做什么,后做什么,哪些并行,哪些串行。

Skills 是能力模块:写作、搜索、代码、测试、发布、数据处理。

Subagents 是劳动力:哪些阶段交给不同 agent 并行跑。

Loop 是迭代机制:不合格就继续改,直到达到标准或触发停止条件。

State 是状态:当前进度、历史结果、失败原因、下一步。

Checkpoints 是人类介入点:发布前确认、生产环境变更前确认、费用超限前确认。

Report 是最终交付:结论、证据、风险、变更、下一步。

这也是为什么我觉得 Claude /workflows 不只是 Claude Code 的一个功能,而是整个 Agent 产品都会补上的一层。

未来数字员工如果要真的可用,不能只靠 prompt,也不能只靠 skill。

它必须有 workflow。

一个公司类比

如果把 Agent 看成公司里的员工:

  • Goal 是 KPI / OKR
  • Workflow 是 SOP / 项目管理机制
  • Skill 是岗位技能和工具箱
  • Loop 是复盘迭代机制
  • Subagent 是临时组建的小组成员
  • Checkpoint 是主管审批和风险控制

没有 Skill,员工不会干活。

没有 Goal,员工不知道为什么干。

没有 Loop,员工做错一次就停在半路。

没有 Workflow,员工每次都靠感觉做事,组织无法规模化。

所以 Workflow 的意义是组织化。

它让 Agent 不只是一个聪明个体,而是一个可以被管理、被调度、被复用的生产单元。

真正的变化:从 Prompt 到 Agent OS

我会把这条演进线概括成:

Prompt 时代:一次性指令
Skill 时代:可复用能力
Subagent 时代:可分工劳动力
Workflow 时代:可复用过程
Agent OS 时代:可调度、可观测、可治理的数字员工

Claude Code /workflows 往前推了一步。

它告诉我们:下一代 Agent 产品的竞争,不只是模型能力,也不是谁的聊天体验更顺。

更重要的是:

  • 能不能把复杂任务拆成稳定流程
  • 能不能让多个 Agent 并行协作
  • 能不能保存中间状态和证据
  • 能不能失败后自动重试或切换路径
  • 能不能在人类需要介入时停下来
  • 能不能把一次成功经验保存成下一次可复用的命令

这才是 Agent 从 demo 走向生产系统的分水岭。

结语

Claude 的 dynamic workflows 不是“又一个 Skill”。

它更像 Agent 世界里的编排引擎:把目标、能力、步骤、子 Agent、循环和状态组织起来,让一次成功经验变成可重复运行的系统。

短期看,它会让 Claude Code 更适合大规模代码审计、迁移、深度研究和复杂方案验证。

长期看,它代表的是一个更大的趋势:

AI Agent 正在从会聊天的工具,变成能被编排的工作流节点。

而真正的数字员工,不会只停留在“回答得好”。

它要能按流程做事,失败后继续修,风险前停下来,最后把结果和证据交给人确认。

这才是 Workflow 的价值。


资料来源:Anthropic Claude Code 官方文档《Orchestrate subagents at scale with dynamic workflows》《Extend Claude with skills》;UseClaw 分析。

UseClaw 持续记录 OpenClaw、Agent 与数字员工的真实案例、方法和产品化实践。了解更多:https://useclaw.net/