OpenClaw 于 2026 年 4 月 29 日发布了 v2026.4.27 版本,本次更新的最大看点是正式集成了 OpenAI Codex Computer Use 功能,AI Agent 现在可以直接操控用户的电脑桌面——这标志着 OpenClaw 从”对话+工具调用”向”视觉+操作”的智能体形态迈出了关键一步。
核心功能:Codex Computer Use 集成
功能概述
Codex Computer Use 允许 AI Agent 通过屏幕截图和鼠标/键盘模拟来操作任何桌面应用。与传统 API 集成不同,这种方式不依赖目标应用是否提供 API——Agent 看到的是屏幕像素,操作的是真实的用户界面。
快速配置
本次更新的 Computer Use 功能设计为开箱即用:
- 极简设置:安装后通过简单配置即可启用,无需复杂的环境准备
- 跨平台支持:同时支持 macOS、Windows 和 Linux
- 安全沙箱:操作在隔离环境中执行,用户可随时介入或终止
典型使用场景
| 场景 | 传统方式 | Computer Use 方式 |
|---|---|---|
| 填写网页表单 | 需要 Selenium/Puppeteer 脚本 | Agent 直接看到页面并填写 |
| 桌面应用操作 | 需要专门的自动化框架 | Agent 像人一样操作界面 |
| 跨应用工作流 | 需要整合多个 API | Agent 在不同窗口间切换操作 |
其他更新亮点
桌面控制全面升级
除了 Computer Use 的集成,桌面控制能力整体得到了增强:
- 更精确的坐标定位和元素识别
- 更好的多显示器支持
- 优化了截图频率和传输效率
更多通讯渠道
新增对多种即时通讯平台的支持,Agent 可以部署在更多终端与用户交互。
启动速度优化
整体启动流程经过优化,Agent 从接收到指令到开始执行的时间显著缩短。
OpenClaw 4 月更新节奏回顾
这是 OpenClaw 在 4 月份的第四次重大更新,迭代密度罕见:
| 版本 | 发布日期 | 核心特性 |
|---|---|---|
| v2026.4.24 | 4 月 25 日 | Google Meet 集成、DeepSeek V4 Flash/Pro、浏览器精确点击 |
| v2026.4.26 | 4 月 28 日 | Google Live Talk、Ollama 重构、Claude Code 迁移 |
| v2026.4.27 | 4 月 29 日 | Codex Computer Use、桌面控制升级、启动优化 |
一周三次大版本,每次聚焦不同方向——从通讯集成到本地模型,再到桌面操作控制,OpenClaw 正在快速构建一个全场景 AI Agent 平台。
行业意义
Computer Use 能力的引入让 OpenClaw 的定位发生了微妙变化:
- 从 AI 助手到 AI 操作员:Agent 不再仅限于回答问题或调用 API,而是可以像真实用户一样操作任何软件
- 降低自动化门槛:无需编写复杂的自动化脚本,用自然语言描述任务即可
- 长尾场景覆盖:传统自动化难以覆盖的桌面应用、旧版系统等场景,现在通过视觉操作都能解决
快速上手
已安装用户直接更新:
openclaw update
新用户安装:
npx @anthropic-ai/openclaw@latest
启用 Computer Use 功能后,Agent 可以处理需要桌面操作的复杂工作流。建议在受控环境中先进行小范围测试,确认安全性和可靠性后再用于生产场景。