Desktop Control 提供完整的桌面自动化能力,使 OpenClaw 能与电脑上的任意应用交互。
它包含像素级鼠标控制、快速键盘输入、带图像识别的屏幕截图、窗口管理与剪贴板操作,并内置安全机制。
以 PyAutoGUI 为核心引擎,并通过 DesktopController 类提供自动化能力。
鼠标移动、点击、拖拽、滚动与键盘事件通过 DesktopController 统一调度。
支持截图、像素检测与可选的 OpenCV 图像识别来定位 UI 目标。
包含 failsafe 角落、暂停控制与可选审批模式,降低误操作风险。
绝对/相对定位、平滑移动、左/右/中键与双击、拖拽和滚动。
高速输入,可配置 WPM,支持热键、特殊按键、组合键与按下/释放控制。
全屏与区域截图、像素颜色检测、图像识别与多显示器支持。
列出窗口、按标题激活、读取窗口信息、最小化/最大化控制。
写入系统剪贴板,并读取剪贴板内容。
failsafe 终止、紧急暂停、边界检查与动作日志。
自动填写网页表单或桌面应用字段。
通过鼠标与键盘模拟控制任何桌面应用。
截图并识别 UI 元素,响应视觉变化。
拖拽文件、跨文件夹移动、多选 Ctrl+点击。
自动化执行桌面应用的 GUI 测试流程。
npx clawhub@latest install desktop-control在终端运行上述命令,或点击页面顶部的安装按钮完成一键安装。
PyAutoGUI、Pillow 与 PyGetWindow 为必需依赖;OpenCV(opencv-python)用于图像识别,可选。
支持 macOS、Linux 与 Windows,部分操作可能需要更高权限。
不可以。需要图形桌面环境。
有。包含 failsafe 角落、暂停控制、可选审批模式与日志记录。
安装 OpenCV(opencv-python)即可启用图像匹配功能。