有一个搜索场景,你可能遇到过。
你打开 Google,输入一个明确的 query。然后 AI Overview 给了你一个回答——但这个回答要么是完全空白,要么跟你问的东西毫无关系。
你搜的是"X 公司的 CEO 是谁",它给你一段关于"CEO 是什么"的科普。
你搜的是一个具体的数字,它给你一段模糊的概述。
你搜的是一个人,它给了另一个人的信息。
这不是"偶尔出错"。这是系统性的断裂。
AI 搜索的两面
Google 在 I/O 2026 上展示了 AI Search 的宏伟蓝图:搜索不再给你链接,它替你把事办了。订餐厅、比较产品、规划行程——从信息检索变成任务执行。
这很性感。
但性感的功能和基础的功能之间,有一个巨大的鸿沟。
当用户搜索一个具体问题,得到一个毫不相关的 AI 回答时,他们不会想"这个 AI 未来能做很多事"。他们只会想"这个东西连基本问题都答不好"。
The Verge 的报道标题用了"so broken"(如此破碎)。不是"有一些问题"——是"破碎"。
为什么这比传统搜索错误更严重
传统搜索也会出错。但传统搜索的"出错"和 AI 搜索的"出错",性质完全不同。
传统搜索返回一堆链接。用户自己判断哪个靠谱。如果第一个链接不相关,用户点第二个。这个过程是透明的——用户可以清楚地看到哪些结果匹配、哪些不匹配。
AI 搜索返回一个回答。一个单一的、确定性的、看起来权威的回答。用户没有选择。他们要么接受,要么离开。
当 AI 给出一个错误回答时,用户面对的不再是"哪条链接不对"——而是"Google 告诉我的这个答案是错的"。
这个心理转换很重要。
在传统搜索中,用户承担了验证信息的责任。在 AI 搜索中,Google 承担了验证信息的责任——至少用户是这么认为的。
所以当 AI Overview 给出一个毫不相关的回答时,用户的失望不是"搜索结果不好"——而是"Google 辜负了我的信任"。
" disregarding"是什么概念
报道中用了一个很重的词:AI Overviews 对某些搜索词会"disregard"(无视)用户的问题。
不是"误解"。不是"部分答错"。是"无视"。
这意味着 AI 系统在某些情况下,根本不是在尝试回答用户的问题——而是在生成一段看起来相关、但实际不相关的文本。
这在技术上是可以解释的:大模型在某些 query 上会触发错误的推理路径。但这在体验上是灾难性的。
一个用户搜索"某药物的副作用",得到的回答却完全不相关。这不是一个"有趣的 bug"——这可能是一个安全问题。
Google 的选择困境
Google 面临一个几乎无解的困境。
一方面,他们需要在 AI 搜索上投入,因为竞争对手(Perplexity、Microsoft Copilot)都在做。不投入就意味着把搜索市场的未来拱手让人。
另一方面,AI 搜索的基础质量问题还没有解决。在大模型能可靠地回答所有类型的问题之前,全面推广 AI Overviews 只会制造更多的用户失望。
但 Google 已经不能回头了。I/O 2026 的整个叙事是"搜索 Agent 化"。退回去承认"AI 搜索还不够好",在商业上和公关上都是不可能的。
所以 Google 只能在前进中修复问题。一边推广,一边修补。
我的看法
Google AI Search 的问题不是技术问题,是期望管理问题。
Google 宣传的 AI Search 是一个"帮你把事办了"的智能助手。但用户实际体验到的,是一个连基本问题都可能答不对的搜索工具。
这两个体验之间的落差,就是信任流失的速度。
更危险的是,当 AI 搜索出错时,它的出错方式比传统搜索更具欺骗性。一个错误的链接,用户一看就知道不对。一个错误的 AI 回答,用户可能根本意识不到它是错的——因为它的语气是确定的、格式是权威的。
Google 需要做的不是"让 AI 搜索更聪明"——而是"让 AI 搜索更诚实"。
诚实的意思是:当不确定答案的时候,直接说"我不确定",而不是编造一个看起来相关但实际上不相关的回答。
诚实的意思是:在某些 query 上,退回到传统搜索模式,给用户一堆链接让他们自己判断。
诚实的意思是:承认 AI 搜索还在测试阶段,而不是把它包装成一个已经成熟的产品。
AI 搜索的未来不取决于它现在能做多少花哨的事。而取决于它能不能在"回答基本问题"这件事上做到可靠。
如果连这件事都做不到,再多的 Agent 功能也只是建立在沙地上的城堡。
主要来源: