mineru

用 MinerU API 解析 PDF/Word/PPT/图片为 Markdown,支持公式、表格、OCR。适用于论文解析、文档提取。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "mineru" with this command: npx skills add EasonAI-5589/mineru

📄 MinerU - 文档解析神器

OpenDataLab 出品

PDF/Word/PPT/图片 → 结构化 Markdown,公式表格全保留!


🔗 资源链接


🎯 功能

支持的文件类型

类型格式
📕 PDF论文、书籍、扫描件
📝 Word.docx
📊 PPT.pptx
🖼️ 图片.jpg, .png (OCR)

核心优势

  1. 公式完美保留 - LaTeX 格式输出
  2. 表格结构识别 - 复杂表格也能搞定
  3. 多语言 OCR - 中英文混排无压力
  4. 版面分析 - 多栏、图文混排自动处理

🚀 API 使用 (v4)

认证

# Header 认证
Authorization: Bearer {YOUR_API_KEY}

单文件解析

# 1. 提交任务
curl -X POST "https://mineru.net/api/v4/extract/task" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://arxiv.org/pdf/2410.17247",
    "enable_formula": true,
    "enable_table": true,
    "layout_model": "doclayout_yolo",
    "language": "en"
  }'

# 返回: {"task_id": "xxx", "status": "pending"}

# 2. 轮询结果
curl "https://mineru.net/api/v4/extract/task/{task_id}" \
  -H "Authorization: Bearer $MINERU_TOKEN"

# 返回: {"status": "done", "result": {...}}

批量解析

# 1. 获取上传 URL
curl -X POST "https://mineru.net/api/v4/file-urls/batch" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -d '{"file_names": ["paper1.pdf", "paper2.pdf"]}'

# 2. 上传文件到返回的 presigned URLs

# 3. 批量提交任务
curl -X POST "https://mineru.net/api/v4/extract/task/batch" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -d '{"files": [{"url": "...", "name": "paper1.pdf"}, ...]}'

⚙️ 参数说明

参数类型说明
urlstring文件 URL (支持 http/https)
enable_formulabool启用公式识别 (默认 true)
enable_tablebool启用表格识别 (默认 true)
layout_modelstringdoclayout_yolo (快) / layoutlmv3 (准)
languagestringen / ch / auto
model_versionstringpipeline / vlm / MinerU-HTML

模型版本对比

版本速度准确度适用场景
pipeline⚡ 快常规文档
vlm🐢 慢最高复杂版面
MinerU-HTML⚡ 快网页样式输出

📂 输出结构

解析完成后下载的 ZIP 包含:

output/
├── full.md           # 完整 Markdown
├── content_list.json # 结构化内容
├── images/           # 提取的图片
└── layout.json       # 版面分析结果

🔧 OpenClaw 集成工作流

论文解析流程

# 1. 创建论文目录
mkdir -p "./paper-reading/[CVPR 2025] NewPaper"
cd "./paper-reading/[CVPR 2025] NewPaper"

# 2. 提交解析任务
TASK_ID=$(curl -s -X POST "https://mineru.net/api/v4/extract/task" \
  -H "Authorization: Bearer $MINERU_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://arxiv.org/pdf/XXXX.XXXXX"}' | jq -r '.task_id')

# 3. 等待完成 & 下载
# (轮询 status 直到 done,然后下载 result.zip)

# 4. 解压
unzip result.zip -d .

环境变量

~/.bashrc 或 OpenClaw config 中设置:

export MINERU_TOKEN="your_api_key_here"

⚠️ 限制

限制数值
单文件大小200 MB
单文件页数600 页
并发任务数根据套餐

💡 使用技巧

  1. arXiv 论文直接用 URL

    https://arxiv.org/pdf/2410.17247
    
  2. 中文论文用 language: ch

  3. 复杂表格用 vlm 模型

  4. 批量处理省 quota

    • 一次提交多个文件,比单个提交更高效

📚 相关资源


论文解析不再手动复制粘贴!📖

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

baidu-search

Comprehensive search API integration for Baidu Qianfan Web Search. Use when Claude needs to perform web searches using Baidu Qianfan's enterprise search API....

Registry SourceRecently Updated
General

Self Memory Manager

管理 Claude 的记忆和工作流程优化。包括:(1) Context 使用管理 (2) 重要信息存档 (3) 定时总结 (4) 工作文件夹维护 用于:context 超过 80%、重要信息需要记录、每日总结、清理旧 session

Registry SourceRecently Updated
General

Seedance Video

Generate AI videos using ByteDance Seedance. Use when the user wants to: (1) generate videos from text prompts, (2) generate videos from images (first frame,...

Registry SourceRecently Updated