lp-lobster-crawler

定向抓取 Webnovel/ReelShorts 等站点的书籍/短剧内容,支持内容分级与钉钉播报。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "lp-lobster-crawler" with this command: npx skills add 7487/lp-lobster-crawler

龙虾爬虫技能

定向抓取 Webnovel 小说和 ReelShorts 短剧的结构化内容,支持增量更新、内容分级(高/中/低)和钉钉机器人播报。

环境初始化

首次使用前,在技能目录下初始化 Python 环境:

cd {{skillPath}}
uv venv .venv
uv pip install -r requirements.txt

不需要安装浏览器。反爬通过 curl_cffi TLS 指纹伪装实现,纯 Python 库,无系统依赖。

后续所有命令都通过 uv run 执行,它会自动激活 .venv 虚拟环境。

触发条件

当用户消息包含以下意图时激活此技能:

  • 抓取/爬取小说、短剧、webnovel、reelshorts 内容
  • 查看爬虫状态、已抓取作品列表
  • 播报抓取结果到钉钉
  • 生成 RSS 订阅源
  • 管理定时抓取任务

命令

所有命令必须在技能目录下执行。先 cd {{skillPath}},再运行命令。

抓取内容

uv run python -m src.cli crawl <spider_name>
  • spider_name 可选值:webnovel(小说)、reelshorts(短剧)
  • 支持传递爬虫参数:uv run python -m src.cli crawl webnovel -a max_pages=5

列出已抓取作品

uv run python -m src.cli list [--site <site>] [--grade <grade>] [--limit <n>]
  • --site:按站点过滤(webnovel / reelshorts)
  • --grade:按分级过滤(high / medium / low)
  • --limit:显示数量,默认 20

查看系统状态

uv run python -m src.cli status

返回数据库统计(作品数、章节数、剧集数)和各分级数量。

播报到钉钉

uv run python -m src.cli broadcast [--site <site>] [--grade <grade>] [--title <title>]

生成 Markdown 消息并发送到钉钉群。需要设置环境变量 DINGTALK_WEBHOOK

管理定时任务

uv run python -m src.cli schedule --action=list    # 查看任务
uv run python -m src.cli schedule --action=load    # 从配置加载
uv run python -m src.cli schedule --action=start   # 启动调度器

生成 RSS 订阅源

uv run python -m src.cli rss [--format rss|atom] [--output <path>] [--site <site>] [--grade <grade>]

默认输出到 data/rss.xml

规则

  1. 首次使用前,必须先运行"环境初始化"步骤安装依赖。如果 uv run 报错找不到模块,重新执行初始化。
  2. 运行爬虫前,先执行 status 确认系统正常。
  3. 用户未指定站点时,询问要抓取 webnovel 还是 reelshorts。
  4. 播报前先用 list 确认有数据可播报。
  5. 钉钉播报需要确认 DINGTALK_WEBHOOK 环境变量已配置。
  6. 抓取可能耗时较长,提前告知用户并在完成后汇报结果。
  7. 不要同时运行多个爬虫实例,避免并发冲突。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Multi Edge-TTS CN

Edge-TTS 在线语音合成 skill。基于微软 Edge TTS 引擎,生成速度快(1-2秒),支持多种音色和输出格式。同时支持飞书(OGG/Opus)和企业微信(AMR)。默认音色 xiaoxiao_lively。需联网。

Registry SourceRecently Updated
General

vedic-destiny

吠陀命盘分析中文入口。用于完整命盘研判、命主盘 Rashi chart 与九分盘 Navamsha chart 联读、既往事件回看、出生时间稳定度判断、事业主题、婚姻主题、时空盘专题,以及基于 Jagannatha Hora PDF、星盘截图或文本命盘数据的系统拆盘。当用户提到完整星盘、事业方向、婚姻问题、关系窗...

Registry SourceRecently Updated
General

One Person Company OS

Build a visual operating cockpit for an AI-native one-person company across promise, buyer, product, delivery, cash, learning, and assets. / 为 AI 一人公司建立可视化经营...

Registry SourceRecently Updated
General

健康追踪

健康追踪技能 - 追踪饮水、睡眠、步数等健康数据,JSON存储。

Registry SourceRecently Updated