x-article-extract

提取 X/Twitter 内容:普通推文、X Article 长文、t.co 短链背后的外部网页

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "x-article-extract" with this command: npx skills add yuxiaoyang2007-prog/x-article-extract

X Article 内容提取技能

能力

从 X/Twitter 链接中提取完整内容,支持三种场景:

场景方法说明
普通推文xreach tweet直接提取推文文本+媒体
X Article 长文Playwright + xreach cookie用无头浏览器打开 Article 页面抓取正文
推文分享外部链接Firecrawl API解析 t.co → 抓取目标网页内容

所有场景自动附带互动数据(浏览/赞/转发/收藏/评论数)。

触发条件

当用户要求提取 X/Twitter 内容时触发,包括但不限于:

  • 「提取这条推文」「抓一下这个 X 链接」
  • 「这条 X Article 讲了什么」
  • 「帮我把这条推文内容拉出来」
  • 直接给出 x.com / twitter.com 链接并要求分析内容

使用方式

1. 提取单条 X 链接

python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
  --url "https://x.com/username/status/123456789"

输出 JSON,包含:

  • title: 标题
  • author: 作者
  • description: 完整内容
  • engagement: 互动数据
  • content_type: tweet / x_article / external_page
  • word_count: 内容字数

2. 提取并入库到内容工厂

python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
  --url "https://x.com/username/status/123456789" \
  --ingest

自动将提取的内容写入内容工厂素材库(ObsidianAdapter),等同于在飞书群发链接 + 入库。

3. 批量提取

python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
  --url "https://x.com/a/status/111" \
  --url "https://x.com/b/status/222"

4. 仅解析 t.co 短链(不提取内容)

python3 ~/.openclaw/workspace/skills/x-article-extract/scripts/extract.py \
  --resolve "https://t.co/abc123"

参数说明

参数必填说明
--urlX/Twitter 链接(可多个)
--ingest提取后自动入库到内容工厂
--resolve仅解析 t.co 短链,不提取内容
--json输出原始 JSON(默认人类可读格式)
--proxy代理地址(默认从环境变量 HTTPS_PROXY 读取)
-v详细日志

依赖

  • xreach (v0.3.0+): X/Twitter CLI,需已认证(xreach auth check
  • Playwright (python): 用于抓取 X Article(pip install playwright && python3 -m playwright install chromium
  • Firecrawl API Key: 用于抓取外部网页(环境变量 FIRECRAWL_API_KEY
  • VPS 代理: X 在国内被屏蔽,需走代理

注意事项

  • xreach 认证 cookie 保存在 ~/.config/xfetch/session.json,过期后需重新认证:xreach auth extract --cookie-source chrome
  • Playwright 首次使用需安装浏览器:python3 -m playwright install chromium
  • X Article 抓取需要 ~10 秒(Playwright 启动 + 页面渲染),普通推文 ~2 秒
  • 如果 Playwright 失败,自动降级为 xreach thread 获取讨论上下文

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Gigo Lobster Resume

🦞 GIGO · gigo-lobster-resume: 续跑入口:v2 stable 当前会清理旧 checkpoint 并从头重跑;保留此 slug 作为旧 checkpoint 兼容入口。 Triggers: 继续试吃 / 恢复评测 / resume tasting / continue lobster...

Registry SourceRecently Updated
General

YiHui CONTEXT MODE

context-mode is an MCP server that saves 98% of your context window by sandboxing tool outputs. It routes large file reads, shell outputs, and web fetches th...

Registry SourceRecently Updated
General

xinyi-drink

Use when users ask about 新一好喝/新一咖啡 drinks, stores, menu, activities, Skill用户大礼包, today drink recommendations, afternoon tea, feeling sleepy, or personalized...

Registry SourceRecently Updated
General

vedic-destiny

吠陀命盘分析中文入口。用于完整命盘研判、命主盘 Rashi chart 与九分盘 Navamsha chart 联读、既往事件回看、出生时间稳定度判断、事业主题、婚姻主题、时空盘专题,以及基于 Jagannatha Hora PDF、星盘截图或文本命盘数据的系统拆盘。当用户提到完整星盘、事业方向、婚姻问题、关系窗...

Registry SourceRecently Updated