OpenClaw 4.24 更新：DeepSeek V4 Flash 成为默认模型，实时语音全面打通

4 月底，OpenClaw（NousResearch 旗下开源 AI Agent 平台，GitHub 约 105k Stars）发布了 2026.4.24 版本更新。这次迭代看似是一次常规升级，但三个变化叠加在一起，意味着 Agent 平台的竞争格局正在被重新定义。

这次更新改变了什么

1. DeepSeek V4 Flash 成为默认模型

新用户安装 OpenClaw 后，默认的推理模型从 Claude Sonnet 换成了 DeepSeek V4 Flash。V4 Pro 也同步加入内置模型目录。这意味着新用户可以零配置地以极低成本开始使用 Agent 能力——根据社区实测，V4 Flash 的性价比使其在处理日常 Agent 任务时”完全够用”。

对于存量用户，这次更新也提供了快速切换的路径。选择新版模型需谨慎，因为新模型在实际 Agent 工作流中的稳定性还需要时间验证。

2. 实时语音全面打通

这是 OpenClaw 4.24 中篇幅最大的升级。Talk、Voice Call 和 Google Meet 现在都支持 realtime voice loops，并且可以在语音通话过程中调用完整的 OpenClaw Agent——这意味着 AI 不再是”听完再说”，而是能边听边想边操作工具。

语音通话还新增了完整的 Agent 中途接入能力：通话过程中可以直接让 Agent 查询数据、操作浏览器或调用外部 API，无需挂断或切换界面。

3. 浏览器自动化：像素级点击

OpenClaw 新增了基于视口坐标的点击能力，可以直接指定页面上的精确坐标进行交互。这在之前的 DOM 元素定位方式覆盖不到的场景下（如 Canvas、自定义 UI 组件）提供了更可靠的操作手段。

4. WhatsApp 语音消息转录

新版本支持转录 WhatsApp 语音消息，进一步扩展了 OpenClaw 的消息接入能力。

与之前版本的对比

能力	4.24 之前	4.24 之后
默认模型	Claude Sonnet	DeepSeek V4 Flash
实时语音	有限支持	全通道打通（Talk/Voice Call/Meet）
语音中的 Agent 调用	不支持	通话中实时接入
浏览器点击	DOM 元素定位	新增视口坐标像素级点击
WhatsApp 语音	不支持	支持转录

快速上手

如果你已经安装了 OpenClaw，升级到最新版本后 DeepSeek V4 Flash 和 V4 Pro 会自动出现在模型选择菜单中：

# 更新到最新版本
openclaw update

# 检查当前版本
openclaw --version  # 应显示 2026.4.24

新用户直接安装即可，默认模型已配置为 DeepSeek V4 Flash：

# 新安装
openclaw install

观察点

将 DeepSeek V4 Flash 作为默认模型的策略值得关注：一方面大幅降低了新用户的入门成本，另一方面也意味着 OpenClaw 正在减少对单一模型供应商的依赖。但 V4 Flash 在复杂 Agent 任务中的稳定性还需要更多实测数据来验证。

实时语音与完整 Agent 能力的打通，让”用自然语言对话来操控 Agent 工作流”从概念走向可用。这一能力是否会在 Agent 交互范式中占据主流，取决于响应延迟和准确率的进一步优化。

这次更新改变了什么

1. DeepSeek V4 Flash 成为默认模型

2. 实时语音全面打通

3. 浏览器自动化：像素级点击

4. WhatsApp 语音消息转录

与之前版本的对比

快速上手

观察点

主要来源

相关内容

awesome-codex-skills 单日涨星 1177，Codex 技能生态正在爆发

AgentField：把 AI Agent 当 Pod 管理——AI 原生基础设施的新玩家

微软开源 Agent Lightning：零侵入式 RL 训练框架，让任何 AI Agent 可优化