browser-use

让AI代理控制浏览器自动化网页操作。支持 Claude/GPT/Gemini/Ollama,可执行填表、购物、搜索等任务。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "browser-use" with this command: npx skills add smseow001/browser-use-guide

browser-use

🌐 Make websites accessible for AI agents
GitHub: browser-use/browser-use (90k+ ⭐)
License: MIT | Language: Python 3.11+ | 安装方式: uv


一、核心定位

browser-use 让 AI 代理能够控制浏览器完成网页自动化任务,核心理念:

Tell your computer what to do, and it gets it done.


二、核心能力

能力说明
填表自动填写表单、求职申请
购物读取购物列表,自动在 Instacart 下单
搜索比价帮用户找 PC 配件、比较价格
网页操作点击、输入、截图、导航
多平台集成Gmail、Slack、Notion 等 1000+ 集成

三、安装方式

3.1 快速安装(uv)

# 1. 创建环境并安装
uv init && uv add browser-use && uv sync

# 2. 安装 Chromium(若无浏览器)
uvx browser-use install

# 3. 运行第一个代理
uvx browser-use init --template default

3.2 OpenClaw 集成安装

# 克隆到 skills 目录
cd /root/.openclaw/workspace/skills
git clone https://github.com/browser-use/browser-use.git browser-use

# 或直接安装
npx clawhub@latest install browser-use

四、配置 API Key

4.1 环境变量配置

# 创建 .env 文件
cat > .env << EOF
# Browser Use 云端 API(推荐,支持 Stealth + Proxy)
BROWSER_USE_API_KEY=your-key

# 或使用其他 LLM
GOOGLE_API_KEY=your-key
ANTHROPIC_API_KEY=your-key
OPENAI_API_KEY=your-key
EOF

4.2 API Key 获取

服务地址费用
Browser Use Cloudcloud.browser-use.com免费额度 + 按量付费
Google AIaistudio.google.com免费额度
Anthropicconsole.anthropic.com按量付费
OpenAIplatform.openai.com按量付费
Ollama(本地)ollama.com免费(自托管)

五、快速开始

5.1 基础代理代码

from browser_use import Agent, Browser, ChatBrowserUse
import asyncio

async def main():
    browser = Browser()  # 本地浏览器
    # browser = Browser(use_cloud=True)  # 云端 Stealth 浏览器

    agent = Agent(
        task="Find the number of stars of the browser-use repo",
        llm=ChatBrowserUse(),  # 或 ChatAnthropic(model='claude-sonnet-4-6')
        browser=browser,
    )
    await agent.run()

if __name__ == "__main__":
    asyncio.run(main())

5.2 指定 LLM 提供商

# Google Gemini
from browser_use import ChatGoogle
agent = Agent(task="...", llm=ChatGoogle(model='gemini-3-flash-preview'), browser=browser)

# Anthropic Claude
from browser_use import ChatAnthropic
agent = Agent(task="...", llm=ChatAnthropic(model='claude-sonnet-4-6'), browser=browser)

# 本地 Ollama
from browser_use import ChatOllama
agent = Agent(task="...", llm=ChatOllama(model='llama3'), browser=browser)

六、CLI 工具

6.1 常用命令

# 打开网页
browser-use open https://example.com

# 查看可点击元素
browser-use state

# 点击元素(按索引)
browser-use click 5

# 输入文本
browser-use type "Hello World"

# 截图
browser-use screenshot page.png

# 关闭浏览器
browser-use close

6.2 模板生成

# 生成默认模板
uvx browser-use init --template default

# 生成高级配置模板
uvx browser-use init --template advanced

# 生成自定义工具示例
uvx browser-use init --template tools

七、自定义工具

from browser_use import Agent, Browser, Tools

# 定义自定义工具
tools = Tools()

@tools.action(description='获取指定 GitHub 仓库的星数')
def get_github_stars(repo: str) -> str:
    """查询 GitHub 仓库的星数"""
    import requests
    r = requests.get(f"https://api.github.com/repos/{repo}")
    return r.json().get("stargazers_count", "Unknown")

# 创建代理
agent = Agent(
    task="查询 browser-use 仓库的星数",
    llm=ChatBrowserUse(),
    browser=Browser(),
    tools=tools,
)
await agent.run()

八、认证与持久化

8.1 复用 Chrome 配置

from browser_use import Agent, Browser

browser = Browser(
    chrome_instance_path="/path/to/chrome",  # 复用本地 Chrome
)

agent = Agent(
    task="登录我的 Gmail 并发送邮件",
    llm=ChatBrowserUse(),
    browser=browser,
)

8.2 同步云端配置

# 同步认证信息到云端
curl -fsSL https://browser-use.com/profile.sh | \
  BROWSER_USE_API_KEY=XXXX sh

九、云端 vs 开源

特性开源版云端版(推荐)
费用免费(需自备 LLM API)免费额度 + 按量
Stealth❌ 需自配✅ Proxy 轮换 + CAPTCHA 解决
维护需自己运维✅ 全托管
自定义工具✅ 深度集成✅ 支持
并发规模受限于本地资源✅ 可水平扩展

十、应用场景示例

10.1 求职申请

agent = Agent(
    task="Fill in this job application with my resume and information.",
    llm=ChatBrowserUse(),
    browser=Browser(),
)
await agent.run()

10.2 购物

agent = Agent(
    task="Put this list of items into my instacart: milk, eggs, bread.",
    llm=ChatBrowserUse(),
    browser=Browser(),
)
await agent.run()

10.3 比价搜索

agent = Agent(
    task="Help me find parts for a custom PC within budget $1500.",
    llm=ChatBrowserUse(),
    browser=Browser(),
)
await agent.run()

十一、故障排除

问题解决方案
Chromium 未安装uvx browser-use install
API Key 报错检查 .env 文件配置
浏览器无法启动chrome --version 确认已安装 Chrome
被网站检测使用云端版 Browser(use_cloud=True)
任务失败增加 max_steps 参数

十二、OpenClaw 集成

12.1 MCP 服务方式(推荐)

# 安装 MCP
cd /root/.openclaw/workspace
npx clawhub@latest install browser-use-mcp

# 添加到 mcporter 配置
openclaw mcp add browser-use --command "python -m browser_use.mcp"

12.2 Claude Code Skill

mkdir -p ~/.claude/skills/browser-use
curl -o ~/.claude/skills/browser-use/SKILL.md \
  https://raw.githubusercontent.com/browser-use/browser-use/main/skills/browser-use/SKILL.md

十三、费用参考

ChatBrowserUse 模型定价(推荐)

类型价格(每 1M tokens)
输入$0.20
缓存输入$0.02
输出$2.00

其他模型对比

模型特点
bu-30b-a3b-previewBrowser Use 专用优化模型
claude-sonnet-4-6Anthropic 最新旗舰
gemini-3-flash-previewGoogle 高效模型
llama3(Ollama)免费本地运行

十四、使用方式

触发场景

用户说「帮我自动填表」→ browser-use 填表示例
用户说「自动帮我购物」→ browser-use 购物示例
用户说「AI 控制浏览器」→ 展示 browser-use 能力
用户说「安装 browser-use」→ 执行安装步骤
用户说「配置 API key」→ 执行配置流程

组合使用

用户:「帮我自动化完成这个求职申请流程」
→ 分析表单字段
→ 调用 browser-use Agent
→ 配置 ChatBrowserUse() LLM
→ 自动执行填表 + 上传简历

十五、关联技能

关联技能关系
chrome-devtools-mcp浏览器自动化底层工具
browser-automation-stealth隐身浏览器技术
cognee-memory记忆管理(跨会话持久化)
ai-research-tools科研数据自动采集

十六、注意事项

⚠️ 注意事项:
- Python >= 3.11 required
- 建议使用 uv 管理依赖
- 云端版有免费额度
- 部分网站有反爬机制,建议使用云端 stealth 浏览器
- 遵守网站使用条款,勿用于非法爬虫

本技能整合 browser-use 完整安装配置与应用指南

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Automation

AutoClaw Browser Automation

Complete browser automation skill with MCP protocol support and Chrome extension

Registry SourceRecently Updated
1K0Profile unavailable
Automation

Browser Cash

Spin up unblocked browser sessions via Browser.cash for web automation. Sessions bypass anti-bot protections (Cloudflare, DataDome, etc.) making them ideal for scraping and automation.

Registry Source
3.8K4Profile unavailable
Coding

OpenCLI Universal CLI Hub

OpenCLI — 通用 CLI Hub,将任何网站、Electron 应用或本地工具转化为命令行接口。66+ 内置命令,支持 Bilibili/Twitter/Reddit/Xiaohongshu/GitHub 等。复用 Chrome 登录态,零 LLM 成本,确定性输出。

Registry SourceRecently Updated
1491Profile unavailable
Coding

SurfAgent

Control a real Chrome browser via SurfAgent — navigate, click, type, screenshot, extract data, crawl sites, and automate web workflows. Uses your persistent...

Registry SourceRecently Updated
950Profile unavailable