Agent Browser 是一款专为 AI 智能体设计的无头浏览器自动化工具。它提供 CLI 接口,可通过简单、可组合的命令导航网页、与元素交互、提取结构化数据并运行 JavaScript。
其核心基于高性能的 Rust 实现,同时提供 Node.js 回退层以确保广泛兼容性。
使用 `agent-browser navigate <url>` 将浏览器指向任意 URL。
使用 `agent-browser snapshot` 捕获页面结构,了解可用元素。
根据快照中的引用,对元素执行点击、输入、滚动和选择操作。
再次截取快照或截图,在继续操作前确认结果。
打开页面并获取结构化元素引用,实现可靠交互。
使用结构化命令与任意页面元素交互。
通过 evaluate 在页面上下文中运行任意 JS。
以编程方式列出、打开、切换和关闭浏览器标签页。
在自动化工作流的任意节点截取截图。
暂停执行指定时长,或等待某个条件满足。
高性能与广泛兼容性兼顾。
自动化重复性浏览器任务,如表单提交和多步骤工作流。
从动态渲染页面中抓取并提取结构化数据。
以编程方式填写并提交带有输入内容的表单。
通过 CLI 命令模拟用户交互,测试 Web 界面。
npx clawhub@latest install agent-browserRun in your terminal,或点击页面顶部的 Install 按钮进行一键安装。
不需要。Agent Browser 完全在本地运行,无需任何 API 密钥或外部服务凭证。
需要 Node.js 与 npm。CLI 通过 npm 全局安装,并提供 Node.js 回退层。
可以。它运行真实浏览器,可通过快照与引用操作 JS 渲染页面。
先获取快照,再用快照中的引用执行点击、输入、滚动与选择等命令。
agent-browser 是面向 AI 智能体的浏览器自动化 CLI,采用快速的 Rust CLI 与 Node.js 回退层。可用 `npm install -g agent-browser` 安装,再运行 `agent-browser install` 下载 Chromium。
使用 `agent-browser open <url>` 进入页面,用 `agent-browser snapshot -i` 获取可交互元素引用,然后通过 `click @e1`、`fill @e2 "text"` 等命令交互,并在页面变化后重新快照。
需要。agent-browser 使用 Rust CLI + Node.js 回退层,且通过 npm 安装需要 Node.js。
agent-browser 提供 macOS、Linux、Windows 的原生 Rust 二进制,并且支持 Node.js 回退。