web-to-feishu

将任意网页链接或本地文件一键转为结构化 Markdown,并保存到飞书云文档或腾讯 ima 笔记。 支持的信源:(1) X/Twitter 推文、长文 Article、Thread 线程;(2) 微信公众号文章; (3) YouTube 视频;(4) 任意 HTML 网页;(5) 本地文件:PDF、Word、PPT、Excel、图片、音频等。 工作流:自动识别 URL/文件类型 → 路由到最佳抓取工具 → 结构化 Markdown → 选择性保存到飞书/ima。 触发词:转文档、抓网页存飞书、网页转文档、web to feishu、url转文档、文件转飞书、存到ima。 当用户提供任意 URL 或本地文件并要求转存为文档时触发。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "web-to-feishu" with this command: npx skills add edwardwason/web-to-feishu

网页内容转飞书/ima文档

将任意网页链接或本地文件一键转为结构化 Markdown,并保存到飞书云文档或腾讯 ima 笔记。

支持的信源

信源URL 特征抓取方式
X/Twitterx.com / twitter.comx-tweet-fetcher
微信公众号mp.weixin.qq.commarkitdown-plus
YouTubeyoutube.com / youtu.bemarkitdown-plus
任意网页其他 http(s):// 链接markitdown-plus

本地文件支持

类型扩展名
PDF.pdf
Word.docx / .doc
PowerPoint.pptx / .ppt
Excel.xlsx / .xls
图片.png .jpg .jpeg .gif .webp
音频.mp3 .wav .m4a .flac
数据.csv .json .xml

输出目的地

目的地环境变量说明
Markdown 文件默认选项,始终生成
飞书云文档FEISHU_APP_ID + FEISHU_APP_SECRET参考 references/feishu-setup.md
腾讯 imaIMA_CLIENT_ID + IMA_API_KEY云端 API,无需本地客户端,参考 references/ima-setup.md

安全配置

⚠️ 凭证必须通过环境变量配置,禁止硬编码:

飞书配置

# 设置环境变量
$env:FEISHU_APP_ID = "your_app_id"
$env:FEISHU_APP_SECRET = "your_app_secret"

参考 references/feishu-setup.md 获取凭证。

ima 配置

# 设置环境变量
$env:IMA_CLIENT_ID = "your_client_id"
$env:IMA_API_KEY = "your_api_key"

参考 references/ima-setup.md 获取凭证。

工作流

步骤 1:转换为 Markdown

python3 scripts/web_to_md.py --url "<url_or_path>" --output <output.md>

路由逻辑:

  • X/Twitter → x-tweet-fetcher 抓取 JSON → tweet_to_md.py 结构化转换
  • 其他所有 → markitdown-plus 直接转换

步骤 2:存入目的地

飞书云文档

from scripts.feishu_client import FeishuClient

client = FeishuClient()
result = client.create_document(title="文档标题", content_md=markdown_content)
print(f"文档 URL: {result['url']}")

腾讯 ima

from scripts.ima_client import IMAClient

client = IMAClient()
result = client.create_note(title="笔记标题", content=markdown_content)
print(f"笔记 URL: {result['url']}")

验证连接

# 验证飞书
python scripts/feishu_client.py --action test

# 验证 ima
python scripts/ima_client.py --action test

故障处理

问题解决方案
x.com SSL 超时x-tweet-fetcher 使用 FxTwitter API 中转
markitdown 模块丢失pip install markitdown
微信反爬拦截markitdown 自动用移动端 UA 重试
飞书凭证无效检查 FEISHU_APP_IDFEISHU_APP_SECRET
ima 凭证无效检查 IMA_CLIENT_IDIMA_API_KEY

依赖

依赖安装
markitdown-pluspip install markitdown
x-tweet-fetcher克隆到 ~/.aily/workspace/skills/x-tweet-fetcher
requestspip install requests
python-dotenvpip install python-dotenv

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

jina-ai-reader

Fetch clean, AI-friendly Markdown content from any URL using Jina.ai Reader. Bypasses paywalls, handles Twitter/X posts, renders JavaScript-heavy pages, retu...

Registry Source
1.2K1Profile unavailable
General

TencentCloud ASR

腾讯云语音识别 ASR Skill,适用于语音转文字、音频转写、字幕生成、会议转录、语音消息识别、 本地文件或 URL 音频识别。包含三种模式:一句话识别(<=60s 短音频)、录音识别极速版 (<=2h/100MB 中长音频快速同步返回)、录音识别(<=5h 长音频异步识别)。支持普通话、 英语、粤语、日语、韩...

Registry SourceRecently Updated
1.4K5Profile unavailable
General

WeChat Article to Markdown

This skill converts WeChat Official Account (微信公众号) article pages into high-quality, clean Markdown format. It should be used when the user provides a WeChat...

Registry SourceRecently Updated
1250Profile unavailable
General

ZeeLin多平台自运营

ZeeLin多平台自运营 — 通义千问 +《四大平台内容生产提示词手册》生成各平台稿,CDP 顺序运营 X / 微博 / 小红书 / 微信公众号草稿。MIT-0 on ClawHub.

Registry SourceRecently Updated
1320Profile unavailable