feishu-doc-to-markdown

智能转换飞书文档为高可用Markdown格式,自动处理私有资源、无效占位符、冗余引用,生成多版本满足不同场景需求

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "feishu-doc-to-markdown" with this command: npx skills add whisperbot/feishu-doc-to-markdown

Skill: 飞书文档智能转换Markdown

技能描述

自动将飞书文档转换为高可用、高信息密度的Markdown文档,智能处理飞书私有资源、无效占位符、冗余引用,生成不同纯净度的版本满足不同场景需求。

适用场景

  • 飞书文档归档存储
  • 飞书内容导入知识库
  • 提取飞书文档核心信息
  • 批量转换飞书文档为通用格式
  • 飞书内容知识蒸馏

核心能力

多版本输出:支持3种不同处理等级的版本,满足不同需求 ✅ 智能内容提取:自动识别图片、图表、白板、表格等非文本内容的核心信息,转换为结构化文本 ✅ 冗余自动清理:自动移除无效占位符、无法访问的内部引用、重复内容、无意义标签 ✅ 自动分类归档:转换后的文档自动按「日期/项目」分类保存到原始资源库 ✅ 知识自动关联:自动提取核心要点,关联到对应项目/领域标签,纳入知识库

处理流程

  1. 内容获取:通过飞书API获取完整的文档原始内容和元信息
  2. 元信息识别:自动识别文档所属项目、领域、类型,生成分类标签
  3. 多版本处理:按照3种等级分别处理生成对应版本
  4. 自动归档:所有版本自动保存到raw_sources/YYYY-MM-DD/[项目名称]/目录下
  5. 知识入库:在LEARNINGS.md中记录文档摘要、核心要点、关联文件路径,纳入知识体系

版本处理规则

版本1:原始备份版

  • 处理规则:不做任何修改,完整保留所有原始内容和格式
  • 保留内容:所有文本、飞书私有标签(<image><whiteboard><mention-doc>等)、格式标记
  • 用途:作为原始凭证永久留存,确保可追溯,不对外提供

版本2:纯文本增强版

  • 处理规则
    1. 移除所有无效资源占位标签(图片、白板、文件、视频等嵌入标签)
    2. 提取非文本内容的上下文信息、标题、说明文字、数据,转换为结构化文本(要点列表、markdown表格、文字描述等)补充到对应位置
    3. 保留可访问的外部链接,移除无法访问的内部引用链接
  • 保留内容:所有有效文本信息、可访问链接、提取的非文本核心信息
  • 用途:完整保留所有有效信息,适合需要完整上下文的场景、需要二次编辑的场景

版本3:最终优化版(默认输出)

  • 处理规则:在纯文本增强版基础上进一步精炼
    1. 移除所有无法访问的内部引用、无效链接、冗余说明文字
    2. 精简重复内容,优化文档结构,合并相似要点
    3. 移除无意义的符号、占位符、格式标记
  • 保留内容:仅保留最核心的有效信息,信息密度最高
  • 用途:适合直接阅读、快速掌握核心要点、知识提炼入库

调用方式

# 基础调用,默认生成最终优化版
feishu_doc_convert <飞书文档链接>

# 指定输出版本
feishu_doc_convert <飞书文档链接> --version raw|enhanced|optimized

# 指定保存目录
feishu_doc_convert <飞书文档链接> --output <目录路径>

# 自动入库到知识库
feishu_doc_convert <飞书文档链接> --sync-to-knowledgebase

最佳实践

  • 默认对外提供「最终优化版」,同时静默保存另外两个版本归档
  • 特殊需求可根据用户要求调整处理规则(如保留图片、保留所有引用等)
  • 所有转换后的文档必须关联到对应的ProjectDomain标签,方便后续检索
  • 核心价值高的文档自动提炼关键经验到知识库的结构化知识层

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Research

SwarmVault

Use SwarmVault when the user needs a local-first knowledge vault that writes durable markdown, graph, search, dashboard, review, chat-session, context-pack,...

Registry SourceRecently Updated
1.1K1Profile unavailable
Research

DocHub

All-in-one document management: batch convert to Markdown, auto-categorize, full-text search, and intelligent output. 全能文档管理技能,整合文档生命周期管理与智能检索。 Trigger: init...

Registry SourceRecently Updated
2240Profile unavailable
Research

Wikimind Skill

Ingest articles, docs, notes, and web pages into your local LLM-WikiMind knowledge base (Karpathy's LLM Wiki pattern). Triggers: add to knowledge base, inges...

Registry SourceRecently Updated
1550Profile unavailable
Research

LLM Wiki Karpathy

Manage and maintain a Markdown wiki with LLM Wiki Karpathy: inspect, repair, compile sources, add pages, answer queries, and lint for quality.

Registry SourceRecently Updated
1620Profile unavailable