腾讯云文章提取器
从腾讯云开发者社区提取文章内容并转换为 Markdown 格式。
快速开始
node ~/.openclaw/workspace/skills/tencent-cloud-article-extractor/scripts/extract_article.mjs <文章URL> [输出文件]
示例:
# 输出到控制台
node ~/.openclaw/workspace/skills/tencent-cloud-article-extractor/scripts/extract_article.mjs https://cloud.tencent.com/developer/article/2636150
# 保存到文件
node ~/.openclaw/workspace/skills/tencent-cloud-article-extractor/scripts/extract_article.mjs https://cloud.tencent.com/developer/article/2636150 article.md
支持的文章格式
- URL 格式:
https://cloud.tencent.com/developer/article/<文章ID> - 自动提取:标题、作者、发布时间、字数统计、阅读时长
- 支持的内容类型:标题、段落、代码块、图片、列表、引用、链接
输出格式
生成的 Markdown 文档包含:
# 文章标题
> 作者:作者名
> 发布时间:2026-03-10 14:29
> 来源:腾讯云开发者社区
> 原文链接:https://cloud.tencent.com/developer/article/xxx
---
**文章统计**:字数 4738 | 预计阅读 17 分钟
---
## 正文内容...
工作原理
- 发送 HTTP 请求获取文章页面
- 从页面
__NEXT_DATA__中提取 JSON 数据 - 解析结构化内容并转换为 Markdown
- 输出到控制台或保存到文件
注意事项
- 需要网络访问腾讯云网站
- 文章必须是公开可访问的
- 部分需要登录的文章可能无法提取
- 图片以原始 URL 引用,不会下载到本地
错误处理
| 错误 | 原因 | 解决方案 |
|---|---|---|
无效的腾讯云文章 URL | URL 格式不正确 | 检查 URL 是否符合 cloud.tencent.com/developer/article/xxx 格式 |
未找到文章数据 | 页面结构变化或需要登录 | 确认文章公开可访问 |
文章内容为空 | 文章可能已被删除 | 检查原文链接是否有效 |
更新日志
v1.0.0 (2026-03-16)
- ✅ 初始版本
- ✅ 支持腾讯云文章提取
- ✅ Markdown 格式输出