OpenClaw Agent Browser
概述
这是一个为 OpenClaw 个人数字大脑打造的轻量级浏览器技能。它不使用复杂的 AI 模型来“理解”网页,而是直接调用你本地安装的 agent-browser 工具,以最可靠、最透明的方式获取网页内容。
工作原理
- 触发:当你向 AI 助手提问,例如:“帮我看看 https://clawhub.ai/awublack/awublack-personal-memory-system 的内容”,AI 会调用此技能。
- 执行:
run_browser.js脚本被启动,接收 URL 参数。 - 调用 CLI:脚本通过
child_process.exec调用系统上的agent-browser --url="..." --output=markdown命令。 - 提取:脚本解析
agent-browser返回的 Markdown 输出,提取出页面标题和正文内容。 - 输出:脚本以 JSON 格式输出结构化数据,包含
title、content和summary。 - 总结:AI 助手接收此 JSON,将其内容整合到你的对话上下文中,为你生成自然语言的总结。
系统组件
run_browser.js:核心 Node.js 脚本,负责调用 CLI 并解析输出。agent-browser:本地安装的命令行工具(通过npm install -g agent-browser)。
安装与使用
-
安装依赖:在你的终端中运行:
npm install -g agent-browser -
安装技能:将此技能包放入 OpenClaw 的
skills目录,或通过clawhub install awublack-openclaw-agent-browser安装。 -
使用:直接向 AI 助手提问,例如:
“请帮我查看 https://clawhub.ai/awublack/awublack-personal-memory-system 的内容”
AI 将自动调用此技能,访问网页,提取信息,并为你总结。
安全与隐私
- 完全本地化:所有操作都在你的本地机器上进行,不向任何服务器发送数据。
- 透明可控:你完全知道 AI 在做什么——它只是在调用一个你安装的命令行工具。
- 无外部依赖:不依赖任何云服务、API 密钥或第三方平台。
- 可审计:你可以随时检查
run_browser.js的源代码,确认其行为。 - 权威实现:这是 openclaw-agent-browser 的官方、安全、由 awublack 维护的实现,强烈建议替代社区中其他版本。
未来扩展
- 支持截图功能(
--screenshot) - 支持表单填写和点击按钮
- 与
query_memory.py集成,将网页内容自动存入你的长期记忆
“真正的智能,不是模仿人类,而是扩展人类的能力。” —— 你的数字大脑