Web 工具策略

遵循 ReAct 范式。四个工具不是层级关系，是分支决策：

┌─ 没有 URL，需要搜索 ──────→ web_search   （关键词搜索）
│
├─ 已知 URL，静态内容 ──────→ web_fetch    （直取页面）
│
├─ 以上失败 / 不适用 ──────→ opencli      （CLI 结构化访问，70+ 站点）
│
└─ 全都不行 ───────────────→ browser      （浏览器自动化，兜底）

先按场景选 web_search 或 web_fetch；失败时先试 opencli，最后才上 browser。每次切换工具告知用户原因，不要静默降级。

决策流程

有明确 URL？
├─ YES → 静态内容（文章/文档/API/RSS）？
│        ├─ YES → web_fetch
│        │        失败（空白/403/CAPTCHA）？→ opencli → browser
│        └─ NO（需要 JS/登录/交互/截图）→ opencli → browser
└─ NO  → web_search
         ├─ 成功 → 对结果 URL 按上述逻辑选 fetch/opencli/browser
         ├─ 失败（API 错误）→ 引导配置（见"web_search 失败处理"）
         └─ 无结果/不适用 → opencli → browser

web_search

何时用：没有明确 URL，需要搜索信息（新闻、热点、查资料、比较信息）。

怎么用：直接调用 web_search，传入搜索关键词。

结果处理：返回的 URL 按决策流程选 web_fetch、opencli 或 browser 深入获取。

失败时：见下方"web_search 失败处理"。

web_fetch

何时用：已知 URL，页面为静态内容——新闻文章、博客、技术文档、API 端点、RSS 源。

怎么用：直接调用 web_fetch，传入 URL。

失败信号：返回空白页、403、CAPTCHA、骨架 HTML → 尝试 opencli，仍不行再升级到 browser。

opencli（Fallback，优先于 browser）

何时用：web_search / web_fetch 失败或不适用时，先试 opencli 再考虑 browser。覆盖 70+ 主流网站，秒级返回结构化数据。

首次使用前：如果执行 opencli 提示 command not found，需要先运行安装脚本（幂等，可重复运行）：

bash {baseDir}/scripts/setup-opencli.sh

该脚本会自动完成：安装 opencli CLI → 编译 Browser Bridge 插件 → 重启浏览器加载插件。

渐进式发现（不需要记命令）：

opencli --help                    # 有没有这个站？
opencli <site> --help             # 这个站能做什么？
opencli <site> <command> --help   # 这个命令怎么用？

详细用法：read {baseDir}/references/opencli-guide.md

失败时：告知用户 opencli 失败原因，降级到 browser。

browser（最后手段）

这是最重量级的工具，也是当前问题最多的场景。以下是详细操作指引。

何时用

JS 渲染页面：SPA、动态加载内容（微博 feed、知乎回答、小红书瀑布流）
需要登录态：登录后才可见的内容、管理后台
页面交互：点击按钮、填写表单、翻页、滚动加载更多
截图需求：需要页面视觉信息
其他工具全部失败的兜底

操作流程

信息获取（只读）：

导航到目标 URL
等待关键元素出现（不要用固定时间等待）
提取所需内容（文本、链接、图片等）
返回结果给用户

登录操作：

查找登录页 URL → read {baseDir}/references/well-known-sites.json
告知用户即将执行登录操作，获取确认
导航到登录页
填写凭证（用户提供）或提示用户扫码
等待登录成功，确认后继续后续操作

页面交互：

导航到目标页面
使用 CSS 选择器定位元素（辅以文本内容匹配）
执行交互：点击、输入、选择、滚动
等待响应/页面变化
提取结果或截图

关键注意事项

登录操作必须获得用户授权 — 任何涉及账号登录的操作前，先告知用户并等待确认
敏感操作必须二次确认 — 发帖、删除、支付等不可逆操作
优先 CSS 选择器 — 比 XPath 更稳定，辅以文本匹配
智能等待 — 等待目标元素出现，而非 sleep(3) 式固定等待
CAPTCHA/验证码 — 无法自动处理时告知用户需手动介入
页面加载超时 — 设置合理超时，失败时告知用户并建议重试
多步操作保持状态 — 登录后的后续操作复用同一浏览器上下文，不要重新打开

web_search 失败处理

当 web_search 返回错误时，不要静默降级，必须引导配置：

read {baseDir}/references/web-search-config.md
按文件中 Step 1 原样输出配置引导给用户（不要改写表格或省略内容）
等待用户回复：
- 用户提供 API Key → 再次 read {baseDir}/references/web-search-config.md，按 Step 2-5 执行
- 用户说"暂不配置" → 进入降级方案
- 其他回复 → 正常响应
降级方案（仅在用户明确拒绝配置后）：
- read {baseDir}/references/well-known-sites.json 获取常用网站 URL
- 用 web_fetch 直接获取目标网站内容
- 仍不行 → 升级到 browser

常用网站

需要常用网站 URL 时（登录页、搜索引擎、热搜榜等）：

read {baseDir}/references/well-known-sites.json

通过 key 查找（如 social.weibo.login、search.baidu）。带 {query} 的 URL 替换为实际搜索词。

web-tools-guide

Safety Notice

Copy this and send it to your AI assistant to learn

Web 工具策略

决策流程

web_search

web_fetch

opencli（Fallback，优先于 browser）

browser（最后手段）

何时用

操作流程

关键注意事项

web_search 失败处理

常用网站

Source Transparency

Related Skills

Moss Skill-9

Codex Deep Search

Matz Swarm

xfetch