消费级显卡跑出 95% SimpleQA：本地 AI 深度研究正在变成现实

去年这个时候，"本地跑深度研究"听起来像是天方夜谭。你需要云端大模型、需要付费 API、需要忍受响应延迟和隐私泄露的隐忧。

现在，一张 RTX 3090，一个 27B 参数的开源模型，就能在 SimpleQA 上跑到约 95% 的准确率。

local-deep-research 这个项目在 GitHub 上安静地长到了 7,098 个 star，这周新增 2,483。6,415 次 commit，440 个分支，155 个 tag——这不是一个 toy project，是一个被认真维护的工具。

它能做什么

一句话：给你一个问题，它会像研究员一样工作。

跟云端 deep research 类产品相比，核心差异就一个：数据不出你的机器。

27B 参数的模型，4-bit 量化后大概 15GB 显存。RTX 3090 有 24GB——刚好够，但不是在裸奔。这意味着什么？

两年前，这个级别的推理能力需要 A100。一年前，需要 4090。现在，一张二手 3090 就行。

这不是线性进步。这是成本曲线上的一次跳水。

SimpleQA 是 OpenAI 出的问答基准，测的是"模型能不能给出简洁准确的事实性回答"。95% 很高，但需要注意几点：

但即便如此，95% 的 SimpleQA 意味着：对于大部分事实核查类任务，本地模型已经够用了。

local-deep-research 不是唯一一个本地研究工具，但它可能是目前最成熟的一个。6,415 次 commit、186 个 open PR、79 个 open issue——这些数字说明社区在认真贡献。

当一张消费级显卡就能跑出接近云端模型的深度研究能力时，"必须用云端"的理由就少了一个。

主要来源：