Gemini 3.1 Flash-Lite 正式 GA：Google 把 API 价格打到 $0.25/M

Google 没开发布会，没发博客，直接在 OpenRouter 上把 Gemini 3.1 Flash-Lite 推成了 GA。

定价很直白：输入 $0.25/M tokens，输出 $1.50/M。这个价格放在今天的小模型战场上，属于直接掀桌子级别。

规格速览

Flash-Lite 不是 Flash 的缩水版——它走的是另一条路线：

预览版 gemini-3.1-flash-lite-preview 5 月 11 日停更，5 月 25 日直接关停。Google 这次没留缓冲期。

把 Flash-Lite 放进当前 API 价格战的上下文里看：

$0.25/M 输入是什么水平？比上个月最便宜的前梯队模型还低一档。如果你的工作流是大批量文档处理、翻译、或者 Agent 的高频轻量调用，这个数字不是"可以考虑"——是"没有理由不用"。

输出 $1.50/M 也不贵，但别被输入价骗了。长回复场景下，输出 token 才是账单的大头。Flash-Lite 适合的任务恰恰是输出短的：分类、摘要、翻译、数据清洗。

昨天 Gemini 3.2 Flash 泄露的文章里提到 Google 正在调整命名体系。现在回头看，Flash-Lite 是这条产品线最底层的棋子：

三层分工明确。Flash-Lite 不是拿来和 Opus、GPT-5.5 拼推理的——它的战场在量不在质。

适合：

不适合：

Google 这次选择通过 OpenRouter 先上 GA 而不是等 Google I/O，信号很有意思。上个月 Google 的 I/O 预告把重头戏押在 Gemini Omni 上，而 Flash-Lite 这种"基建型"模型不需要舞台——它直接进 API catalog，开发者自己会来用。

这种静默发布对 Google 来说越来越像常态。不开发布会，不搞营销，把价格放到足够低，让账单说话。

Preview 版本还有不到三周就关了。如果你的 pipeline 还在跑 gemini-3.1-flash-lite-preview，现在该切了。

主要来源：