union-search-skill

当用户需要跨多个平台搜索内容时使用此技能,包括 GitHub(仓库、代码、问题)、Reddit(帖子、子版块、用户)、小红书、抖音、Bilibili、YouTube、Twitter、Google、Tavily、秘塔搜索、火山引擎,以及通用搜索引擎(DuckDuckGo、Brave、Yahoo、Bing、Wikipedia、Anna's Archive),或从 18 个图片平台(百度、Bing、Google、Pixabay、Unsplash、火山引擎等)下载图片。提供统一的搜索接口,支持结构化输出格式、结果过滤、排序、自动响应归档和批量图片下载(保留元数据)。

Safety Notice

This listing is imported from skills.sh public index metadata. Review upstream SKILL.md and repository scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "union-search-skill" with this command: npx skills add runningz1/union-search-skill/runningz1-union-search-skill-union-search-skill

联合搜索技能

目的

提供跨多个平台的统一搜索能力,支持 20+ 个平台的内容搜索和数据获取。所有搜索脚本遵循标准化的输入/输出约定,提供可靠、可读的结果。

何时使用此技能

  • 跨多个平台搜索内容(GitHub、Reddit、社交媒体、搜索引擎)
  • 按时间范围、互动指标或内容类型过滤结果
  • 批量搜索/下载并归档原始响应
  • 需要无 API 密钥的搜索方案

可用的搜索工具

所有脚本位于 scripts/ 目录,每个模块都有详细的 README 文档。

开发者与社区搜索

平台描述文档
GitHub仓库、代码、问题/PR搜索GITHUB_README.md
Reddit帖子、子版块、用户搜索REDDIT_README.md

社交媒体与网络搜索

平台描述文档
小红书笔记搜索,支持过滤排序XIAOHONGSHU_README.md
抖音视频搜索,支持过滤选项DOUYIN_README.md
Bilibili视频搜索,双API支持BILIBILI_README.md
Twitter帖子和时间线搜索TWITTER_README.md
YouTube视频、评论搜索YOUTUBE_README.md
知乎中文问答平台ZHIHU_README.md
GoogleCustom Search APIGOOGLE_SEARCH_README.md
TavilyAI驱动搜索引擎TAVILY_SEARCH_README.md
秘塔搜索AI驱动搜索,智能摘要METASO_README.md
火山引擎字节跳动融合信息搜索VOLCENGINE_README.md
Exa神经搜索,代码/公司/人物/深度研究EXA_SEARCH_README.md

注意: 火山引擎的图片搜索功能已集成到 union_image_search 模块

通用搜索引擎(无需 API 密钥)

平台描述文档
DuckDuckGo隐私搜索引擎DUCKDUCKGO_README.md
Brave隐私搜索引擎BRAVE_README.md
Yahoo雅虎搜索引擎YAHOO_README.md
Bing微软搜索引擎BING_README.md
Wikipedia百科全书搜索WIKIPEDIA_README.md
Anna's Archive电子书搜索ANNASARCHIVE_README.md

其他搜索工具

工具描述文档
联合搜索统一多平台搜索接口UNION_SEARCH_README.md
图片搜索18平台批量图片下载 (含火山引擎)UNION_IMAGE_SEARCH_README.md
RSS订阅源内容搜索RSS_SEARCH_README.md

快速开始

1. 配置凭据

在项目根目录创建 .env 文件(参考 .env.example):

# 复制模板
cp .env.example .env

# 编辑配置
# 填入必要的 API 凭据

详细配置指南: 参考 API 凭据获取指南

2. 执行搜索

所有脚本支持类似的命令行参数:

# 联合搜索(推荐)- 同时搜索多个平台
python scripts/union_search/union_search.py "machine learning" --group dev --limit 3

# GitHub 搜索
python scripts/github/github_search.py repo "machine learning" --language python --stars ">1000"

# 小红书搜索
python scripts/xiaohongshu/tikhub_xhs_search.py --keyword "美食" --limit 10

# 图片搜索(无需 API)
python scripts/union_image_search/multi_platform_image_search.py --keyword "cats" --num 50

# DuckDuckGo 搜索(无需 API)
python scripts/duckduckgo/duckduckgo_search.py "Python programming"

3. 查看结果

  • 终端输出: 格式化的 Markdown 表格
  • 原始响应: 保存在 responses/ 目录(使用 --save-raw 参数)

使用工作流

标准搜索流程

  1. 运行前: 验证 .env 配置存在且包含有效凭据
  2. 运行: 从技能目录直接执行脚本
  3. 运行后: 检查终端输出和 responses/ 目录中的原始响应文件

通用参数

大多数工具支持以下参数:

  • --limit / -n: 返回的结果数量
  • --json: JSON 格式输出
  • --pretty: 格式化 JSON 输出
  • --markdown: Markdown 格式输出
  • -o / --output: 保存输出到文件
  • --save-raw: 保存原始 API 响应到 responses/ 目录

最佳实践

结果过滤:

  • 使用 --limit 控制输出量
  • 应用时间过滤器获取最新内容
  • 按互动指标排序以找到热门内容

响应管理:

  • 永远不要将完整的原始 JSON 粘贴到对话中
  • 需要完整数据访问时引用 responses/ 文件
  • 使用 grep/jq 从保存的响应中提取特定字段

多平台搜索:

  • 为不同平台依次运行脚本
  • 使用保存的响应文件比较跨平台结果

参考文档

详细的配置、限制和问题排查信息,请参考 references/ 目录:

常见问题速查

问题解决方案详细文档
缺少凭据检查 .env 文件配置API 凭据
API 速率限制降低请求频率或限制结果数量速率限制
网络超时增加超时值或使用代理问题排查
无效参数查看模块 README 或使用 --help各模块 README
403 Blocked使用代理或降低请求频率问题排查
平台特定问题查看平台说明平台说明

项目结构

union-search-skill/
├── scripts/                    # 所有搜索脚本
│   ├── union_search/           # 联合搜索(新增)
│   ├── github/                # GitHub 搜索
│   ├── reddit/                # Reddit 搜索
│   ├── xiaohongshu/           # 小红书搜索
│   ├── douyin/                # 抖音搜索
│   ├── bilibili/              # Bilibili 搜索
│   ├── youtube/               # YouTube 搜索
│   ├── google_search/         # Google 搜索
│   ├── tavily_search/         # Tavily 搜索
│   ├── exa_search/            # Exa 神经搜索
│   ├── duckduckgo/            # DuckDuckGo 搜索
│   ├── brave/                 # Brave 搜索
│   ├── yahoo/                 # Yahoo 搜索
│   ├── bing/                  # Bing 搜索
│   ├── wikipedia/             # Wikipedia 搜索
│   ├── annasarchive/          # Anna's Archive 搜索
│   ├── union_image_search/    # 图片搜索
│   ├── rss_search/            # RSS 搜索
│   └── zhihu/                 # 知乎搜索
├── references/                 # 参考文档
│   ├── api_credentials.md     # API 凭据获取指南
│   ├── rate_limits.md         # 速率限制说明
│   ├── platform_notes.md      # 平台特定说明
│   ├── troubleshooting.md     # 问题排查指南
│   └── google_search_guide.md # Google 搜索技巧
├── responses/                  # API 响应存档
├── .env.example               # 环境变量模板
├── SKILL.md                   # 本文件
└── README.md                  # 项目说明

配置优先级

所有工具支持三种配置方式(优先级从高到低):

  1. 命令行参数: --token YOUR_TOKEN--api-key YOUR_KEY
  2. 环境变量: 在项目根目录的 .env 文件中配置
  3. 配置文件: 工具特定的配置文件(如 GitHub 的 ~/.github-search.json

获取帮助

  • 模块文档: 每个模块都有详细的 README(scripts/*/README.md
  • 参考文档: 查看 references/ 目录中的详细指南
  • 命令行帮助: 使用 --help 参数查看脚本用法
  • 项目 README: 查看 README.md 了解项目概览

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Coding

openclaw-version-monitor

监控 OpenClaw GitHub 版本更新,获取最新版本发布说明,翻译成中文, 并推送到 Telegram 和 Feishu。用于:(1) 定时检查版本更新 (2) 推送版本更新通知 (3) 生成中文版发布说明

Archived SourceRecently Updated
Coding

ask-claude

Delegate a task to Claude Code CLI and immediately report the result back in chat. Supports persistent sessions with full context memory. Safe execution: no data exfiltration, no external calls, file operations confined to workspace. Use when the user asks to run Claude, delegate a coding task, continue a previous Claude session, or any task benefiting from Claude Code's tools (file editing, code analysis, bash, etc.).

Archived SourceRecently Updated
Coding

ai-dating

This skill enables dating and matchmaking workflows. Use it when a user asks to make friends, find a partner, run matchmaking, or provide dating preferences/profile updates. The skill should execute `dating-cli` commands to complete profile setup, task creation/update, match checking, contact reveal, and review.

Archived SourceRecently Updated
Coding

clawhub-rate-limited-publisher

Queue and publish local skills to ClawHub with a strict 5-per-hour cap using the local clawhub CLI and host scheduler.

Archived SourceRecently Updated