AI 编程不再抛硬币:Archon 用 YAML 工作流把 Agent 变成流水线

AI 编程不再抛硬币:Archon 用 YAML 工作流把 Agent 变成流水线

让 AI 帮你修个 bug,跑三次可能得到三个不同的结果。

有时候它忘了跑测试,有时候 PR 描述写得敷衍,有时候它跳过了规划直接开写——每次运行都取决于模型的”心情”。AI 编程工具最大的痛点不是能力不够,而是没有确定性

Archon(coleam00/Archon)的解决思路很直接:Dockerfile 规范了基础设施,GitHub Actions 规范了 CI/CD,那 AI 编码流程也需要一套规范。

从 Agent 构建器到工作流引擎

这个项目经历了一次完全重写——从 Python 迁移到 TypeScript,定位也从”AI Agent 构建器”彻底转型为”AI 编码工作流引擎”。核心变化在于:不再试图让 AI 自主决定怎么做,而是把开发流程编码成 YAML 工作流,AI 只在需要智能判断的环节介入。

一个典型的工作流长这样:

nodes:
  - id: plan
    prompt: "Explore the codebase and create an implementation plan"
  - id: implement
    depends_on: [plan]
    loop:
      prompt: "Read the plan. Implement the next task. Run validation."
      until: ALL_TASKS_COMPLETE
  - id: run-tests
    depends_on: [implement]
    bash: "bun run validate"     # 确定性步骤,不需要 AI
  - id: review
    depends_on: [run-tests]
    prompt: "Review all changes against the plan."
  - id: create-pr
    depends_on: [review]
    prompt: "Push changes and create a pull request"

五个节点,规划→实现→测试→审查→PR,其中只有 implementreview 需要 AI 介入,run-tests 是纯确定性执行。AI 不再是”全权代理”,而是”按需调用的智能模块”。

17 个预设工作流

Archon 内置了 17 个工作流,覆盖日常开发的绝大多数场景:

工作流用途
archon-fix-github-issue分类→调查→实现→验证→PR→审查→自修复
archon-idea-to-pr想法→规划→实现→验证→PR→5 个并行审查→自修复
archon-comprehensive-pr-review5 个并行审查员,自动修复
archon-smart-pr-review按复杂度分类,运行针对性审查
archon-architect架构扫描,降低复杂度
archon-refactor-safely安全重构,带类型检查钩子
archon-resolve-conflicts检测→分析→解决→验证冲突
archon-plan-to-pr执行已有规划到 PR

你也可以在 .archon/workflows/ 目录下定义自己的 YAML 工作流,提交到仓库后整个团队就运行同一套流程。

关键设计:git worktree 隔离

每次工作流运行都在独立的 git worktree 中执行。这意味着你可以同时启动 5 个修复任务,互不冲突,各自在独立的分支上工作。完成后直接回到一个已经创建好 PR 的分支。

“Fire and forget”——踢出去就不用管了,回来收 PR 就行。

多渠道触发

除了 CLI 和 Web UI,Archon 还支持从 Slack、Telegram、Discord、GitHub Webhooks 远程触发工作流。Telegram 和 Discord 各 5 分钟就能接入,Slack 和 GitHub 需要 15 分钟。

Web UI 包含聊天界面、实时工作流监控面板、拖拽式工作流编辑器,以及一个统一的消息中心——所有平台的消息都汇聚在一起。

架构与依赖

Platform Adapters (Web/CLI/Telegram/Slack/Discord/GitHub)

    Orchestrator
    ↓           ↓
Command      Workflow      AI Assistants (Claude / Codex / Pi)
Handler      Executor

存储层是 SQLite 或 PostgreSQL(7 张表),管理代码库、对话、会话、工作流运行记录。

目前主要依赖 Claude Code(也支持 Codex 和 Pi),安装方式有 Homebrew、一键脚本、Docker。从源码编译需要 Bun + Claude Code。

数据

  • ⭐ 20.5k Star,3.1k Fork
  • 1,355 个 commits,最新提交 9 小时前
  • TypeScript 编写,当前开发分支
  • MIT 协议
  • 官网:archon.diy

Archon 不是另一个”帮你写代码的 Agent”。它解决的是更底层的问题:当你已经有 Agent 之后,怎么让它每次跑出来结果都一样。对于那些被 AI 编程的不确定性折磨过的团队,这个项目值得关注。