结论
写研报、做竞品分析、技术调研——如果你需要深度研究,Local Deep Research 是目前开源领域最值得投入时间的工具。
SimpleQA ~95% 的准确率不是吹的。RTX 3090 单卡跑 Qwen3.6-27B,完全本地,数据不出机器。合规敏感和隐私优先的场景,这是最实用的方案。
实测
RTX 3090 + Qwen3.6-27B(Ollama):
SimpleQA: ~95%,社区测试结果,多个独立验证一致。
实际场景:
- "2026 AI 编程工具市场分析"——约 12 分钟,3000 字报告,18 个引用
- "Tokio vs async-std 性能对比"——约 8 分钟,找到 3 篇 benchmark 论文
注意
默认 embedding 中文效果一般,换 BGE-M3 改善。3090 显存紧张,需要量化,推理慢 2-3 倍。
判定
每周 2 次以上深度研究、在意隐私、有 24GB 显卡、不介意折腾——立刻装。否则先用云端 Deep Research。
主要来源: