Claude /workflows：Agent 从“会干活”走向“会组织工作”

龙虾学堂2026年5月29日

Claude Code 的 dynamic workflows 不是 Routines，也不是另一个 Skill；它把多 Agent 编排、循环、状态和验收标准写进可复用脚本，让一次成功经验变成稳定工作方式。

真正重要的不是 Claude 又多了一个命令，而是 Agent 开始从“会回答问题”走向“能稳定组织工作”。

重新核查官方文档后，这篇文章的关键词应该是：Claude Code dynamic workflows / /workflows。

不是 rootless，也不应该把主题写成 Routines。

Routines 更偏“定时任务 / 事件触发 / 云端持续运行”；而这次真正值得讨论的是 Claude Code 的 dynamic workflows：Claude 可以为一个复杂任务写出一段 workflow 脚本，在后台编排多个 subagents，并用 /workflows 查看、暂停、恢复、停止或保存这次运行。

这件事的意义不只是“开更多 agent”。

它代表 Agent 开始从一次性对话，走向可编排、可复用、可观察、可复盘的工作系统。

官方到底发布了什么？

Anthropic 官方文档里，这个功能叫 dynamic workflows。

官方描述很清楚：

workflow 是一段 JavaScript 脚本
这段脚本负责大规模编排 subagents
Claude 可以根据你的任务描述生成 workflow
workflow 在后台运行，主会话保持响应
中间结果存在脚本变量里，而不是全塞进 Claude 的上下文窗口
适合代码库审计、大规模迁移、深度研究、复杂方案交叉验证
内置示例是 /deep-research
运行和历史可以通过 /workflows 查看和管理
跑通后，可以把 workflow 保存成以后可复用的命令

官方文档还强调：dynamic workflows 当前是 research preview，需要 Claude Code v2.1.154 或更新版本。

所以这篇文章应该聚焦的是：

Workflow 把“怎么组织多个 Agent 做一件复杂事”从聊天上下文里拿出来，变成一段可读、可运行、可保存、可复用的编排脚本。

这才是关键。

它和 Skill 有什么区别？

一句话：

Skill 是能力模块，Workflow 是任务编排。

Skill 解决的是“我会怎么做某类事”。

比如：

怎么跑测试
怎么检查 PR
怎么写公众号文章
怎么发布到某个平台
怎么分析一个代码仓库

Skill 更像工具箱里的工具，或者员工掌握的岗位技能。

而 Workflow 解决的是“这件事应该怎样组织起来完成”。

比如一个修 bug 的 workflow 可能是：

复现问题
定位相关代码
提出修复方案
修改代码
运行测试
如果失败，回到第 3 步
输出变更说明和风险提示

这里面可能会调用多个 skills：代码阅读、测试、Git、PR 总结、风险审查。

所以二者不是替代关系，而是组合关系：

Workflow 编排 Skills，Skills 支撑 Workflow。

Skill 是“会什么”；Workflow 是“怎么把这些能力串起来，稳定完成一件事”。

它和 Subagent 有什么区别？

官方文档里有一个很重要的区分：Subagents、Skills、Workflows 都能处理多步骤任务，但区别在于“谁持有计划”。

Subagent 是 Claude 临时派出去的 worker。

Skill 是 Claude 按说明书执行的一段能力。

Workflow 则是脚本本身持有计划：循环、分支、中间结果、阶段推进，都写进 workflow runtime 里。

这意味着：

Subagent 更像“我叫几个人来帮忙”
Skill 更像“我拿出某个工具包”
Workflow 更像“我写了一套可重复执行的项目作战图”

过去 Claude 在主会话里 turn by turn 地协调子任务，所有结果都堆进上下文窗口。

Workflow 的变化是：

把编排逻辑从 Claude 的即时对话里，迁移到一段可运行的脚本里。

这就是它比“多开几个 agent”更重要的地方。

它和 Loop 有什么区别？

Loop 是 Workflow 里的控制结构。

Loop 关注的是：如果没达到标准，就继续做。

比如：

测试失败 → 分析失败原因 → 修改 → 再测试
标题不够好 → 生成 10 个 → 评分 → 保留 top3 → 再改
研究结论不可靠 → 换来源 → 交叉验证 → 再综合

Loop 很重要，因为没有 loop 的 Agent 很容易只执行一轮，然后把半成品交给人。

但 Loop 本身不是完整工作流。

完整 Workflow 还需要：

目标定义
阶段拆分
子 Agent 分工
中间结果记录
质量检查
失败重试
人类检查点
成功/失败判断
保存和复用机制

所以可以这么理解：

Workflow 是路线图，Loop 是路线图里的“反复迭代直到达标”。

它和 Goal 有什么区别？

Goal 是终点，Workflow 是路线。

Goal 只回答一个问题：什么叫完成？

比如：

修复这个 bug，并确保现有测试通过
把这篇文章发到公众号草稿箱
每天早上生成 10 条高质量 AI 资讯
对一个技术趋势做交叉验证，输出有来源的研究报告

但只有 Goal 不够。

如果只有目标，没有流程，Agent 每次都会临场发挥。一次可能做得很好，下一次可能漏掉关键步骤。

Workflow 的作用，就是把一次成功的执行经验固化下来，让下一次可以稳定复现。

这也是 Agent 从“聪明”走向“可靠”的关键。

为什么 `/workflows` 重要？

因为它解决了 Agent 产品化里的几个老问题。

第一，临场规划不稳定。

以前我们给 Agent 一个大目标，它会自己拆步骤。但每次拆出来都可能不一样。Workflow 把流程显式化，减少随机性。

第二，中间过程容易丢。

多 Agent 做复杂任务时，最容易爆上下文：每个 worker 的结果、判断、失败原因、证据链都塞回主会话，最后主 Agent 既要读、又要筛、又要总结。

官方 workflows 的设计是：中间结果可以留在脚本变量里，Claude 上下文只接收最终需要汇报的结果。

这对大规模任务很关键。

第三，经验难复用。

一个高手用 Claude Code 跑通了一套代码库审计流程，如果没有 Workflow，下次还要重新描述。

Workflow 跑通后可以保存成命令，这意味着一次成功经验可以沉淀成以后可复用的工作方式。

第四，复杂任务需要可观察。

/workflows 可以看到每个阶段、agent 数量、token、耗时，还可以进入某个 agent 看它的 prompt、工具调用和结果。

这说明 Agent 不再只是“黑箱回答”，而是开始像工程任务一样有运行面板。

Flynn 说的“把八个工作流串成一个稳定工作方式”

这其实正好是 Workflow 的核心。

不是把八个 prompt 放在一起。

也不是把八个 skill 名字列出来。

而是把八个已经跑通的工作单元，整理成一个更稳定的总流程：

Goal：最终要交付什么
Workflow：八个阶段按什么顺序推进
Skills：每个阶段需要哪些能力
Subagents：哪些阶段可以并行派人做
Loop：哪些阶段不合格要重跑
State：每一步产出什么中间结果
Checkpoint：哪些节点必须让人确认
Report：最后如何汇总证据、结论和下一步

比如一套“文章生产 workflow”可以是：

选题判断：这个题值不值得写
官方核查：确认原始信源和术语
概念拆解：定义关键词和边界
观点生成：形成文章主线
案例补充：加入产品/业务类比
草稿写作：生成初稿
事实审校：检查有没有错名、错功能、错来源
发布适配：公众号、UseClaw、封面、CTA、摘要

这八步每一步都可以是一个小 workflow，也可以是一个 skill。

但真正稳定的方式，是把它们串成一个总 workflow，并且明确每一步的输入、输出、失败重试和人工确认点。

这就是 Agent OS 里最重要的一层：

不是让 Agent 更会聊天，而是让 Agent 的工作方式可管理。

放到 OpenClaw / UseClaw 里怎么看？

如果用我们自己的语言拆，一个可生产化的 Workflow 应该是这样：

Workflow = Goal + Steps + Skills + Subagents + Loop + State + Checkpoints + Report

Goal 是验收标准：什么叫完成，什么叫失败，什么需要升级给人。

Steps 是执行路径：先做什么，后做什么，哪些并行，哪些串行。

Skills 是能力模块：写作、搜索、代码、测试、发布、数据处理。

Subagents 是劳动力：哪些阶段交给不同 agent 并行跑。

Loop 是迭代机制：不合格就继续改，直到达到标准或触发停止条件。

State 是状态：当前进度、历史结果、失败原因、下一步。

Checkpoints 是人类介入点：发布前确认、生产环境变更前确认、费用超限前确认。

Report 是最终交付：结论、证据、风险、变更、下一步。

这也是为什么我觉得 Claude /workflows 不只是 Claude Code 的一个功能，而是整个 Agent 产品都会补上的一层。

未来数字员工如果要真的可用，不能只靠 prompt，也不能只靠 skill。

它必须有 workflow。

一个公司类比

如果把 Agent 看成公司里的员工：

Goal 是 KPI / OKR
Workflow 是 SOP / 项目管理机制
Skill 是岗位技能和工具箱
Loop 是复盘迭代机制
Subagent 是临时组建的小组成员
Checkpoint 是主管审批和风险控制

没有 Skill，员工不会干活。

没有 Goal，员工不知道为什么干。

没有 Loop，员工做错一次就停在半路。

没有 Workflow，员工每次都靠感觉做事，组织无法规模化。

所以 Workflow 的意义是组织化。

它让 Agent 不只是一个聪明个体，而是一个可以被管理、被调度、被复用的生产单元。

真正的变化：从 Prompt 到 Agent OS

我会把这条演进线概括成：

Prompt 时代：一次性指令
Skill 时代：可复用能力
Subagent 时代：可分工劳动力
Workflow 时代：可复用过程
Agent OS 时代：可调度、可观测、可治理的数字员工

Claude Code /workflows 往前推了一步。

它告诉我们：下一代 Agent 产品的竞争，不只是模型能力，也不是谁的聊天体验更顺。

更重要的是：

能不能把复杂任务拆成稳定流程
能不能让多个 Agent 并行协作
能不能保存中间状态和证据
能不能失败后自动重试或切换路径
能不能在人类需要介入时停下来
能不能把一次成功经验保存成下一次可复用的命令

这才是 Agent 从 demo 走向生产系统的分水岭。

结语

Claude 的 dynamic workflows 不是“又一个 Skill”。

它更像 Agent 世界里的编排引擎：把目标、能力、步骤、子 Agent、循环和状态组织起来，让一次成功经验变成可重复运行的系统。

短期看，它会让 Claude Code 更适合大规模代码审计、迁移、深度研究和复杂方案验证。

长期看，它代表的是一个更大的趋势：

AI Agent 正在从会聊天的工具，变成能被编排的工作流节点。

而真正的数字员工，不会只停留在“回答得好”。

它要能按流程做事，失败后继续修，风险前停下来，最后把结果和证据交给人确认。

这才是 Workflow 的价值。

资料来源：Anthropic Claude Code 官方文档《Orchestrate subagents at scale with dynamic workflows》《Extend Claude with skills》；UseClaw 分析。

UseClaw 持续记录 OpenClaw、Agent 与数字员工的真实案例、方法和产品化实践。了解更多：https://useclaw.net/