"Claude /workflows:Agent 从“会干活”走向“会组织工作”"
"Claude Code 的 dynamic workflows 不是 Routines,也不是另一个 Skill;它把多 Agent 编排、循环、状态和验收标准写进可复用脚本,让一次成功经验变成稳定工作方式。"
真正重要的不是 Claude 又多了一个命令,而是 Agent 开始从“会回答问题”走向“能稳定组织工作”。
重新核查官方文档后,这篇文章的关键词应该是:Claude Code dynamic workflows / /workflows。
不是 rootless,也不应该把主题写成 Routines。
Routines 更偏“定时任务 / 事件触发 / 云端持续运行”;而这次真正值得讨论的是 Claude Code 的 dynamic workflows:Claude 可以为一个复杂任务写出一段 workflow 脚本,在后台编排多个 subagents,并用 /workflows 查看、暂停、恢复、停止或保存这次运行。
这件事的意义不只是“开更多 agent”。
它代表 Agent 开始从一次性对话,走向可编排、可复用、可观察、可复盘的工作系统。
官方到底发布了什么?
Anthropic 官方文档里,这个功能叫 dynamic workflows。
官方描述很清楚:
- workflow 是一段 JavaScript 脚本
- 这段脚本负责大规模编排 subagents
- Claude 可以根据你的任务描述生成 workflow
- workflow 在后台运行,主会话保持响应
- 中间结果存在脚本变量里,而不是全塞进 Claude 的上下文窗口
- 适合代码库审计、大规模迁移、深度研究、复杂方案交叉验证
- 内置示例是
/deep-research - 运行和历史可以通过
/workflows查看和管理 - 跑通后,可以把 workflow 保存成以后可复用的命令
官方文档还强调:dynamic workflows 当前是 research preview,需要 Claude Code v2.1.154 或更新版本。
所以这篇文章应该聚焦的是:
Workflow 把“怎么组织多个 Agent 做一件复杂事”从聊天上下文里拿出来,变成一段可读、可运行、可保存、可复用的编排脚本。
这才是关键。
它和 Skill 有什么区别?
一句话:
Skill 是能力模块,Workflow 是任务编排。
Skill 解决的是“我会怎么做某类事”。
比如:
- 怎么跑测试
- 怎么检查 PR
- 怎么写公众号文章
- 怎么发布到某个平台
- 怎么分析一个代码仓库
Skill 更像工具箱里的工具,或者员工掌握的岗位技能。
而 Workflow 解决的是“这件事应该怎样组织起来完成”。
比如一个修 bug 的 workflow 可能是:
- 复现问题
- 定位相关代码
- 提出修复方案
- 修改代码
- 运行测试
- 如果失败,回到第 3 步
- 输出变更说明和风险提示
这里面可能会调用多个 skills:代码阅读、测试、Git、PR 总结、风险审查。
所以二者不是替代关系,而是组合关系:
Workflow 编排 Skills,Skills 支撑 Workflow。
Skill 是“会什么”;Workflow 是“怎么把这些能力串起来,稳定完成一件事”。
它和 Subagent 有什么区别?
官方文档里有一个很重要的区分:Subagents、Skills、Workflows 都能处理多步骤任务,但区别在于“谁持有计划”。
Subagent 是 Claude 临时派出去的 worker。
Skill 是 Claude 按说明书执行的一段能力。
Workflow 则是脚本本身持有计划:循环、分支、中间结果、阶段推进,都写进 workflow runtime 里。
这意味着:
- Subagent 更像“我叫几个人来帮忙”
- Skill 更像“我拿出某个工具包”
- Workflow 更像“我写了一套可重复执行的项目作战图”
过去 Claude 在主会话里 turn by turn 地协调子任务,所有结果都堆进上下文窗口。
Workflow 的变化是:
把编排逻辑从 Claude 的即时对话里,迁移到一段可运行的脚本里。
这就是它比“多开几个 agent”更重要的地方。
它和 Loop 有什么区别?
Loop 是 Workflow 里的控制结构。
Loop 关注的是:如果没达到标准,就继续做。
比如:
- 测试失败 → 分析失败原因 → 修改 → 再测试
- 标题不够好 → 生成 10 个 → 评分 → 保留 top3 → 再改
- 研究结论不可靠 → 换来源 → 交叉验证 → 再综合
Loop 很重要,因为没有 loop 的 Agent 很容易只执行一轮,然后把半成品交给人。
但 Loop 本身不是完整工作流。
完整 Workflow 还需要:
- 目标定义
- 阶段拆分
- 子 Agent 分工
- 中间结果记录
- 质量检查
- 失败重试
- 人类检查点
- 成功/失败判断
- 保存和复用机制
所以可以这么理解:
Workflow 是路线图,Loop 是路线图里的“反复迭代直到达标”。
它和 Goal 有什么区别?
Goal 是终点,Workflow 是路线。
Goal 只回答一个问题:什么叫完成?
比如:
- 修复这个 bug,并确保现有测试通过
- 把这篇文章发到公众号草稿箱
- 每天早上生成 10 条高质量 AI 资讯
- 对一个技术趋势做交叉验证,输出有来源的研究报告
但只有 Goal 不够。
如果只有目标,没有流程,Agent 每次都会临场发挥。一次可能做得很好,下一次可能漏掉关键步骤。
Workflow 的作用,就是把一次成功的执行经验固化下来,让下一次可以稳定复现。
这也是 Agent 从“聪明”走向“可靠”的关键。
为什么 /workflows 重要?
因为它解决了 Agent 产品化里的几个老问题。
第一,临场规划不稳定。
以前我们给 Agent 一个大目标,它会自己拆步骤。但每次拆出来都可能不一样。Workflow 把流程显式化,减少随机性。
第二,中间过程容易丢。
多 Agent 做复杂任务时,最容易爆上下文:每个 worker 的结果、判断、失败原因、证据链都塞回主会话,最后主 Agent 既要读、又要筛、又要总结。
官方 workflows 的设计是:中间结果可以留在脚本变量里,Claude 上下文只接收最终需要汇报的结果。
这对大规模任务很关键。
第三,经验难复用。
一个高手用 Claude Code 跑通了一套代码库审计流程,如果没有 Workflow,下次还要重新描述。
Workflow 跑通后可以保存成命令,这意味着一次成功经验可以沉淀成以后可复用的工作方式。
第四,复杂任务需要可观察。
/workflows 可以看到每个阶段、agent 数量、token、耗时,还可以进入某个 agent 看它的 prompt、工具调用和结果。
这说明 Agent 不再只是“黑箱回答”,而是开始像工程任务一样有运行面板。
Flynn 说的“把八个工作流串成一个稳定工作方式”
这其实正好是 Workflow 的核心。
不是把八个 prompt 放在一起。
也不是把八个 skill 名字列出来。
而是把八个已经跑通的工作单元,整理成一个更稳定的总流程:
Goal:最终要交付什么
Workflow:八个阶段按什么顺序推进
Skills:每个阶段需要哪些能力
Subagents:哪些阶段可以并行派人做
Loop:哪些阶段不合格要重跑
State:每一步产出什么中间结果
Checkpoint:哪些节点必须让人确认
Report:最后如何汇总证据、结论和下一步
比如一套“文章生产 workflow”可以是:
- 选题判断:这个题值不值得写
- 官方核查:确认原始信源和术语
- 概念拆解:定义关键词和边界
- 观点生成:形成文章主线
- 案例补充:加入产品/业务类比
- 草稿写作:生成初稿
- 事实审校:检查有没有错名、错功能、错来源
- 发布适配:公众号、UseClaw、封面、CTA、摘要
这八步每一步都可以是一个小 workflow,也可以是一个 skill。
但真正稳定的方式,是把它们串成一个总 workflow,并且明确每一步的输入、输出、失败重试和人工确认点。
这就是 Agent OS 里最重要的一层:
不是让 Agent 更会聊天,而是让 Agent 的工作方式可管理。
放到 OpenClaw / UseClaw 里怎么看?
如果用我们自己的语言拆,一个可生产化的 Workflow 应该是这样:
Workflow = Goal + Steps + Skills + Subagents + Loop + State + Checkpoints + Report
Goal 是验收标准:什么叫完成,什么叫失败,什么需要升级给人。
Steps 是执行路径:先做什么,后做什么,哪些并行,哪些串行。
Skills 是能力模块:写作、搜索、代码、测试、发布、数据处理。
Subagents 是劳动力:哪些阶段交给不同 agent 并行跑。
Loop 是迭代机制:不合格就继续改,直到达到标准或触发停止条件。
State 是状态:当前进度、历史结果、失败原因、下一步。
Checkpoints 是人类介入点:发布前确认、生产环境变更前确认、费用超限前确认。
Report 是最终交付:结论、证据、风险、变更、下一步。
这也是为什么我觉得 Claude /workflows 不只是 Claude Code 的一个功能,而是整个 Agent 产品都会补上的一层。
未来数字员工如果要真的可用,不能只靠 prompt,也不能只靠 skill。
它必须有 workflow。
一个公司类比
如果把 Agent 看成公司里的员工:
- Goal 是 KPI / OKR
- Workflow 是 SOP / 项目管理机制
- Skill 是岗位技能和工具箱
- Loop 是复盘迭代机制
- Subagent 是临时组建的小组成员
- Checkpoint 是主管审批和风险控制
没有 Skill,员工不会干活。
没有 Goal,员工不知道为什么干。
没有 Loop,员工做错一次就停在半路。
没有 Workflow,员工每次都靠感觉做事,组织无法规模化。
所以 Workflow 的意义是组织化。
它让 Agent 不只是一个聪明个体,而是一个可以被管理、被调度、被复用的生产单元。
真正的变化:从 Prompt 到 Agent OS
我会把这条演进线概括成:
Prompt 时代:一次性指令
Skill 时代:可复用能力
Subagent 时代:可分工劳动力
Workflow 时代:可复用过程
Agent OS 时代:可调度、可观测、可治理的数字员工
Claude Code /workflows 往前推了一步。
它告诉我们:下一代 Agent 产品的竞争,不只是模型能力,也不是谁的聊天体验更顺。
更重要的是:
- 能不能把复杂任务拆成稳定流程
- 能不能让多个 Agent 并行协作
- 能不能保存中间状态和证据
- 能不能失败后自动重试或切换路径
- 能不能在人类需要介入时停下来
- 能不能把一次成功经验保存成下一次可复用的命令
这才是 Agent 从 demo 走向生产系统的分水岭。
结语
Claude 的 dynamic workflows 不是“又一个 Skill”。
它更像 Agent 世界里的编排引擎:把目标、能力、步骤、子 Agent、循环和状态组织起来,让一次成功经验变成可重复运行的系统。
短期看,它会让 Claude Code 更适合大规模代码审计、迁移、深度研究和复杂方案验证。
长期看,它代表的是一个更大的趋势:
AI Agent 正在从会聊天的工具,变成能被编排的工作流节点。
而真正的数字员工,不会只停留在“回答得好”。
它要能按流程做事,失败后继续修,风险前停下来,最后把结果和证据交给人确认。
这才是 Workflow 的价值。
资料来源:Anthropic Claude Code 官方文档《Orchestrate subagents at scale with dynamic workflows》《Extend Claude with skills》;UseClaw 分析。
UseClaw 持续记录 OpenClaw、Agent 与数字员工的真实案例、方法和产品化实践。了解更多:https://useclaw.net/