Dograh：开源语音 Agent 平台，让 AI 开口说话不再是大厂专利

语音交互这件事，一直被大厂垄断。

OpenAI 有 Realtime API，Google 有 Gemini Live，微软有 Azure Speech——但这些都是闭源的商业服务。你想自建一个语音 Agent？没那么容易。

直到 Dograh 出现。

Dograh 是什么

Dograh 是一个开源的语音 Agent 平台。2,100+ star，431 fork，昨天刚发布了 1.30.1 版本。

它的定位很明确：让任何人都能搭建自己的语音 AI Agent，不需要依赖任何商业云服务。

Dograh 不是一个简单的语音转文字工具。它是一个完整的语音 Agent 平台，包含：

从项目结构来看，Dograh 是一个相当成熟的工程：

语音交互是 AI Agent 最重要的交互方式之一。但目前市场上几乎全是闭源方案。Dograh 填补了这个空白。

想象一下这些场景：

这些在过去需要大量工程投入才能实现的事情，现在有了一个开源的基础平台。

Dograh 还在早期阶段。2,100 star 不算少，但离大规模生产可用还有距离。文档、社区、生态都还在建设中。

但方向是对的。语音 Agent 的开源化是必然趋势，Dograh 是第一批认真做这件事的项目之一。