Kimi 用 DeepSeek 架构,DeepSeek 用 Kimi 优化器:中国模型的"开放共生"模式
Kimi K2.6 基于 DeepSeek v3 的 MoE+MLA 架构,而 DeepSeek V4 的训练优化器源自 Kimi 团队的 Muon。中国头部开源模型形成"你中有我、我中有你"的技术循环,以 1/8 的训练成本实现闭源级性能。
每日筛选关键变化,保留值得继续看的内容。
Kimi K2.6 基于 DeepSeek v3 的 MoE+MLA 架构,而 DeepSeek V4 的训练优化器源自 Kimi 团队的 Muon。中国头部开源模型形成"你中有我、我中有你"的技术循环,以 1/8 的训练成本实现闭源级性能。
OpenAI 于 4 月 29 日在 AWS Bedrock 正式上线 GPT-5.5、Codex Agent 和全新 Bedrock Managed Agents 服务。这标志着 OpenAI 结束了与 Microsoft 的独占合作,企业 AI 正式进入多云 Agentic 时代。
Google 发布 Gemini CLI v0.40.0,新增本地 Gemma 模型智能路由支持,简单任务本地免费处理,复杂任务自动切换云端 Gemini,构建"免费+付费"混合架构。
Kimi K2.6 基于 DeepSeek v3 的 MoE+MLA 架构,而 DeepSeek V4 的训练优化器源自 Kimi 团队的 Muon。中国头部开源模型形成"你中有我、我中有你"的技术循环,以 1/8 的训练成本实现闭源级性能。
OpenAI 于 4 月 29 日在 AWS Bedrock 正式上线 GPT-5.5、Codex Agent 和全新 Bedrock Managed Agents 服务。这标志着 OpenAI 结束了与 Microsoft 的独占合作,企业 AI 正式进入多云 Agentic 时代。
Google 发布 Gemini CLI v0.40.0,新增本地 Gemma 模型智能路由支持,简单任务本地免费处理,复杂任务自动切换云端 Gemini,构建"免费+付费"混合架构。
Google 宣布将 Gemini AI 助手带入数百万辆汽车,从传统的数字交互扩展到物理世界的车载场景,标志着 AI 助手从手机屏幕走向驾驶舱的关键一步。
AI Agent 的根本瓶颈不再是模型智能,而是每次开会话都失忆。AGENTS.md 塞不下百万 token 的领域知识,RAG 搜不到"未知的未知"。如何让 Agent 像新人一样通过 pair 内化知识?
Anthropic 团队公开了其内部 Agent 工作流实践:由 Claude Agent 完成 90% 的代码编写,一个 Agent 负责分发,多个 Agent 并行执行,1 小时内完成原本需要数天的工作。