核心结论
Future AGI 将其完整的端到端 Agent 工程与优化平台开源(Apache 2.0 许可)。这不只是一个 trimmed-down 的社区版本,而是包含 UI、后端、仿真引擎、评估系统、优化循环、可观测性和 Guardrails 的全栈平台。对于正在将 Agent 推向生产环境的团队来说,这是目前最完整的一体化开源方案。
平台架构全景
Future AGI 将平台拆分为 6 个独立可安装的模块,既可组合使用,也可单独集成到现有工作流:
| 模块 | 安装方式 | 核心能力 |
|---|---|---|
| future-agi | docker compose up -d | 主仓库,完整自托管平台 |
| traceAI | pip install fi-instrumentation-otel | 50+ AI 框架零配置 OTel 追踪 |
| ai-evaluation | pip install ai-evaluation | 50+ 评估指标 + Guardrail 扫描器 |
| agent-opt | pip install agent-opt | 6 种 Prompt 优化算法 |
| simulate-sdk | pip install agent-simulate | 语音 Agent 仿真(LiveKit + Silero VAD) |
| agentcc | pip install agentcc | 网关客户端,100+ LLM 供应商 |
发生了什么
核心能力一览
🧪 仿真引擎:在上线前,用数千轮多轮对话(文本 + 语音)针对真实用户画像和对抗性输入进行测试。支持语音 Agent 仿真,集成 LiveKit 和 Silero VAD。
📊 统一评估:50+ 指标在一个 API 调用下完成——groundedness、工具使用准确率、PII 泄露检测、自定义评分规则。不再需要拼凑多个评估工具。
🛡️ Guardrails:18 种内置防护规则 + 15 个供应商适配器,支持内联防护和独立部署。覆盖安全、合规、偏见、幻觉等维度。
👁️ 可观测性:OpenTelemetry 原生追踪,支持 LangChain、LlamaIndex、CrewAI、DSPy 等 50+ 框架。这意味着你可以直接接入现有项目,无需修改代码。
🎛️ 网关层:OpenAI 兼容网关,100+ 供应商,15 种路由策略。一套 API key 管理所有模型调用。
🔁 自动优化:6 种 Prompt 优化算法——GEPA、PromptWizard、ProTeGi 等——从生产 trace 中学习并自动迭代 prompt。
为什么是现在?
Future AGI 的判断是:大多数 AI Agent 在生产中失败,是因为团队拼凑的评估、可观测性和 Guardrails 永远无法形成闭环。仿真在上线前做,评估在上线后做,Guardrails 在运行时做——但每个环节的 trace 数据不会自动反馈到下一个版本。
Future AGI 的核心价值主张是:把整个闭环折叠到一个平台里。
为什么重要
1. Agent 工程化的「瑞士军刀」
目前的 Agent 工具链是割裂的:
- 用 LangSmith / Langfuse 做追踪
- 用 Braintrust / LangSmith 做评估
- 用 NeMo Guardrails / Guardrails AI 做安全防护
- 用各种手工脚本做 prompt 优化
Future AGI 将这些整合到一个可自托管的平台中,Apache 2.0 许可意味着你可以自由修改和商用。
2. 自优化能力是差异点
6 种 prompt 优化算法是平台最有想象力的部分。这意味着:
- 生产 trace 自动收集 → 评估系统打分 → 优化算法迭代 prompt → 新 prompt 自动部署
- 从「人工调 prompt」转向「系统自动进化 prompt」
- 对于需要持续运营 Agent 的团队(客服、销售、数据分析),这可以显著减少人工调优成本
3. 对现有工具链的影响
- 与 LangSmith:Future AGI 支持 LangChain 追踪,但提供了更完整的评估 + 优化闭环
- 与 Langfuse:同样支持 OTel,但 Future AGI 多了仿真和优化层
- 与 Braintrust:评估能力重叠,但 Future AGI 是完整平台而非纯评估工具
竞品对比
| 维度 | Future AGI | LangSmith | Langfuse | Braintrust |
|---|---|---|---|---|
| 追踪 | ✅ 50+ 框架 | ✅ LangChain 优先 | ✅ OTel 原生 | 有限 |
| 评估 | ✅ 50+ 指标 | ✅ 自定义 | ⚠️ 基础 | ✅ 强项 |
| 仿真 | ✅ 文本+语音 | ❌ | ❌ | ❌ |
| Guardrails | ✅ 18 种内置 | ⚠️ 需集成 | ❌ | ❌ |
| Prompt 优化 | ✅ 6 种算法 | ❌ | ❌ | ❌ |
| 自托管 | ✅ 完整 | ❌ SaaS | ✅ | ❌ SaaS |
| 开源许可 | Apache 2.0 | 闭源 | SSPL | 闭源 |
行动建议
谁应该关注
- 正在将 Agent 推向生产的团队:需要一个从仿真到评估到优化的完整闭环
- 语音 Agent 开发者:simulate-sdk 是目前少见的开源语音 Agent 仿真方案
- 多模型路由场景:agentcc 网关支持 100+ 供应商和 15 种路由策略
- 不想被 SaaS 绑定的团队:完整自托管 + Apache 2.0
如何上手
# 快速启动完整平台
git clone https://github.com/future-agi/future-agi
cd future-agi
docker compose up -d
# 或者单独使用评估模块
pip install ai-evaluation
- GitHub:
github.com/future-agi - Cloud 试用:
futureagi.com - 文档:
docs.futureagi.com
注意事项
- 目前处于 nightly release 阶段,stable 版本尚未发布
- 模块较多,建议先从一个模块(如 traceAI)开始集成
- 6 种优化算法的实际效果取决于你的 Agent 场景,需要在真实数据上验证