加载失败
这篇关于 Claude Code(Anthropic 的命令行编程助手)的博文在讲 dynamic workflows:把一个编码任务拆成多个阶段,让多个 agent 并行工作、互相复核、必要时反复修正,并且可以在本地或 cloud 运行,工作流脚本用 JavaScript 编写。文中拿 Bun(一个 JavaScript runtime)从 Zig 语言重写到 Rust 作为代表案例,声称借助大量并行 agent、双重 reviewer 和后续 fix loop,完成了几十万行到上百万行级别的迁移并保持很高的测试通过率。评论区的争论点主要不是“AI 能不能更快”,而是“AI 能不能更正确”:一边担心这只是更高效地烧 token,另一边认为多代理对抗和 test suite 才是关键。讨论里还提到 Cloudflare(云服务公司)也用了同名功能,以及 Claude 过去的 /ultrathink 等模式,说明 agent orchestration 已经进入产品化竞争阶段。
很多评论者认为,真正的瓶颈不是 Claude 能跑多快,而是能不能做对。与其让更多 agent 并行吞 token,他们更想要的是更细粒度的中断、回退、手动注入想法,甚至直接编辑文件读取过程来纠偏。有人把这种方向讽刺成 tokenmaxxing,担心长时间、多轮复核只是在更贵地放大错误。还有人提到,大型任务里 AI 常会悄悄改坏不该动的东西,甚至把测试系统本身弄坏,导致 CI 绿了但质量并没提升。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9] [来源10] [来源11]
另一派从设计逻辑上替它辩护:让多个 agent 从不同角度独立工作,再互相挑错、互相反驳,直到结果逐步收敛。这里的关键不是“大家达成共识”,而是拿 test suite、详细 spec 或真实可运行结果来做 ground truth。评论里把这类思路类比为长期存在的 adversarial ML 方法,强调这是把对抗式验证搬进代码工作流。也有人补充说,人和 AI 都可能对错误形成共识,所以最终必须以真正能工作的结果为准。
Anthropic 团队成员列出了不少内部用例,试图证明 dynamic workflows 在大规模机械迁移和重复性优化上很有用。最醒目的例子是 Bun(一个 JavaScript runtime)从 Zig 重写到 Rust:据说用了约 75 万行 Rust、11 天、99.8% 测试通过率,还通过多个 workflow 并行处理字段 lifetime、文件迁移和后续的性能修正。除此之外,还有减少 token 效率浪费、把 tree-sitter、WASM 相关模块迁到 TypeScript、加速 CI、修 flaky tests、降低误报权限提示、优化 Claude Agent SDK 启动时间、以及批量删除上万行代码等案例。质疑者则认为这些多半是机械重构,本来就适合 agent,未必足以证明“动态工作流”本身有多新。
不少问题集中在怎么把这套能力真正用起来,而不只是看演示。有人关心 workflow 能不能复用、能不能在团队间共享、是否会提供作者和分享文档,以及能不能让不同成员保持一致的质量。也有人追问它是用什么语言写、跑在本地还是云端,得到的答案是 JavaScript,而且可本地或云端运行;Anthropic 还表示功能会尽量落到 Claude Agent SDK(Anthropic 的 agent 开发层)里,供 CLI、Desktop、VSCode 和 cloud 共享。还有评论希望它别锁死在 Anthropic 模型上,最好能把部分步骤交给本地模型或其他 LLM。
[来源1] [来源2] [来源3] [来源4] [来源5] [来源6] [来源7] [来源8] [来源9]
一些人觉得这和已有的 sub-agents 或多 agent orchestration 差别不大,只是把更多 agent、分阶段流程和更长运行时间包装成了新功能。有人直接概括说,主要区别就是能并行更多 agent,再加上半结构化的分步执行。也有人注意到 Cloudflare(云服务公司)刚发布了同名 Dynamic Workflows,质疑 Anthropic 为什么也用这个名字。更有评论觉得,这类流程在 Claude 和 OpenAI 里早就能手工拼出来,像是 /ultrathink 时代的回潮。
dynamic workflows: 把任务拆成多步、可分叉、可回环的 agent 编排方式,强调并行、复核和迭代。
tokenmaxxing: 一种带讽刺意味的说法,指刻意让系统消耗更多 token 的做法。
ground truth: 用于校验结果的外部真实标准,通常指 test suite、spec 或实际可运行行为,而不是模型自己的共识。
Claude Agent SDK: Anthropic 的 agent 开发层,供 Claude Code 的 CLI、Desktop、VSCode 和 cloud 等产品共享能力。
WASM: WebAssembly,一种可在浏览器或接近原生环境中运行的低级字节码格式。