Gemini CLI v0.40 支持本地 Gemma:Google 的"免费+付费"智能路由策略
Google 发布 Gemini CLI v0.40.0,新增本地 Gemma 模型智能路由支持,简单任务本地免费处理,复杂任务自动切换云端 Gemini,构建"免费+付费"混合架构。
每日筛选关键变化,保留值得继续看的内容。
Google 发布 Gemini CLI v0.40.0,新增本地 Gemma 模型智能路由支持,简单任务本地免费处理,复杂任务自动切换云端 Gemini,构建"免费+付费"混合架构。
AI Agent 的根本瓶颈不再是模型智能,而是每次开会话都失忆。AGENTS.md 塞不下百万 token 的领域知识,RAG 搜不到"未知的未知"。如何让 Agent 像新人一样通过 pair 内化知识?
NVIDIA 发布 Dynamo 项目,专门为 Agentic AI 重构推理基础设施。传统推理栈假设每次请求是独立的,但 Agent 编码会话会产生数百次 API 调用和大量重复的上下文计算。Dynamo 通过 KV 感知路由和上下文复用,在同等硅片上实现 2.7 倍性能提升。
Google 发布 Gemini CLI v0.40.0,新增本地 Gemma 模型智能路由支持,简单任务本地免费处理,复杂任务自动切换云端 Gemini,构建"免费+付费"混合架构。
AI Agent 的根本瓶颈不再是模型智能,而是每次开会话都失忆。AGENTS.md 塞不下百万 token 的领域知识,RAG 搜不到"未知的未知"。如何让 Agent 像新人一样通过 pair 内化知识?
NVIDIA 发布 Dynamo 项目,专门为 Agentic AI 重构推理基础设施。传统推理栈假设每次请求是独立的,但 Agent 编码会话会产生数百次 API 调用和大量重复的上下文计算。Dynamo 通过 KV 感知路由和上下文复用,在同等硅片上实现 2.7 倍性能提升。
旧金山 AI 防务公司 Scout AI 完成 1 亿美元 A 轮融资,反映 AI+ 国防安全赛道正在成为 2026 年资本最热方向,单笔 A 轮规模逼近传统 B/C 轮。
AI 芯片厂商 Cerebras 据报正筹备最高 40 亿美元的 IPO,目标估值约 400 亿美元。作为 WSE(晶圆级引擎)的发明者,Cerebras 选择在大厂自研芯片和 NVIDIA 垄断之间的缝隙中寻找资本市场认可。AI 基础设施军备竞赛正在催生新一代半导体上市公司。
TauricResearch 的 TradingAgents 项目以 59K+ stars 登顶 GitHub Trending,这是一个用多 Agent LLM 框架做金融交易的开源方案,日增 2100+ 星。