paper-diagram

多模态论文可视化引擎 — 从 PDF 或纯文本论文自动生成学术插图。 支持:全篇扫描识别可图化内容、双编码器架构图/算法流程图/动机图生成、 自校核机制、LaTeX/Word 图注输出、Matplotlib 结果图精确绘图。 也包含独立的 PDF → Text 提取工具。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "paper-diagram" with this command: npx skills add ljk00000/ynu-papergraphgeneration-qclaw

paper-diagram-skill

从论文(PDF 或纯文本)自动生成学术插图的完整工具链。

工具概览

工具功能调用方式
draw.py论文可视化主流程python draw.py [args]
pdf_to_text.pyPDF → 纯文本提取python pdf_to_text.py [args]

工具 1:PDF → Text 提取

将 PDF 文件转换为纯文本,供 draw.py 使用。

# 基本用法
python {baseDir}/scripts/pdf_to_text.py "/path/to/paper.pdf"

# 限制页数(取前 20 页)
python {baseDir}/scripts/pdf_to_text.py "/path/to/paper.pdf" --max-pages 20

# 输出到文件
python {baseDir}/scripts/pdf_to_text.py "/path/to/paper.pdf" -o extracted.txt

支持的后端(自动选择): pdfminer.six → PyMuPDF → pdfplumber → PyPDF2 → pypdf

注意:推荐先安装 pip install pdfminer.six,提取质量最高。


工具 2:论文图生成

快速开始

# 方式 A:从 PDF 直接生成(自动提取 + 画图)
python {baseDir}/scripts/draw.py \
  --pdf-path "/path/to/paper.pdf" \
  --user-requirement "Transformer 架构图" \
  --api-url "https://api.example.com/generate" \
  --api-key "sk-your-key"

# 方式 B:扫描模式(自动识别所有可图化内容)
python {baseDir}/scripts/draw.py \
  --pdf-path "/path/to/paper.pdf" \
  --mode scan

# 方式 C:批量生成(选定的图)
python {baseDir}/scripts/draw.py \
  --pdf-path "/path/to/paper.pdf" \
  --mode scan \
  --scan-results "<base64-encoded-results>" \
  --selected-ids "1,3,5" \
  --api-url "..." --api-key "..."

# 方式 D:直接传入论文文本
python {baseDir}/scripts/draw.py \
  --paper-content "论文纯文本内容..." \
  --user-requirement "画一个算法流程图" \
  --style cvpr

核心参数

参数说明默认值
--pdf-pathPDF 文件路径(会自动提取文本)
--paper-content直接传入论文纯文本
--user-requirement用户对图片的描述
--modesingle(单图) 或 scan(全篇扫描)single
--api-url生图 API 地址环境变量
--api-key生图 API 密钥环境变量
--style学术风格: cvpr neurips icml naturecvpr
--skip-check跳过自校核False
--section-ref对应论文章节(如 Section 3.1

环境变量

生图 API 凭证按以下优先级自动解析,任意一个有值即可

优先级API Key 变量API URL 变量
1 (推荐)BANANA2_API_KEYBANANA2_API_URL
2ACEDATA_API_KEYPAPER_DIAGRAM_API_URL
3PAPER_DIAGRAM_API_KEY

未设置 URL 时默认 https://api.acedata.cloud/nano-banana/images

推荐在 ~/.openclaw/openclaw.json 中配置:

{
  "skills": {
    "paper-diagram": {
      "env": {
        "BANANA2_API_URL": "https://api.acedata.cloud/nano-banana/images",
        "BANANA2_API_KEY": "your-api-key-here",
        "PAPER_DIAGRAM_LLM_URL": "https://your-llm-api/v1/chat/completions",
        "PAPER_DIAGRAM_LLM_KEY": "your-llm-key-here",
        "PAPER_DIAGRAM_LLM_MODEL": "gpt-4"
      }
    }
  }
}

生成的图类型

类型说明生成方式
teaser动机/概念对比图Mermaid → AI 生图
architecture系统架构图Mermaid → AI 生图
flowchart算法流程图Mermaid → AI 生图
environment实验环境图Mermaid → AI 生图
results结果对比图Matplotlib 代码绘图(精确数据)

学术风格预设

预设场景主色调
cvprCV/CG 会议蓝色系
neuripsML/NLP 会议紫橙系
icmlML 会议蓝红绿系
natureScience/Nature 期刊柔蓝柔绿

输出

  • 图片文件:保存到 outputs/ 目录(或设置的输出目录)
  • LaTeX 图注:可直接复制到论文
  • Word 图注:纯文本格式
  • Mermaid 拓扑:可导出用于其他绘图工具

自校核机制

生成图前会自动对比拓扑描述与原文:

  • ✅ 一致 → 直接生成
  • ⚠️ 小问题 → 询问用户(接受 / 重新生成 / 手动修改)
  • ❌ 严重错误 → 建议重新生成

推荐工作流

论文 PDF
  │
  ▼
pdf_to_text.py  ──→  纯文本
  │                  │
  ▼                  ▼
draw.py (scan)   draw.py (single)
  │                  │
  ▼                  ▼
扫描报告           指定描述 → 生成单张图
  │
  ▼
用户选择 (e.g. 1,3,5)
  │
  ▼
draw.py (batch)  ──→  多张图 + LaTeX 图注

安装依赖

pip install pdfminer.six requests

可选(提升 PDF 提取质量):

pip install pymupdf pdfplumber pypdf

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

通义晓蜜 - 智能外呼

触发阿里云晓蜜外呼机器人任务,自动批量拨打电话。适用于批量外呼、客户回访、满意度调查、简历筛查约面试等场景。可从前置工具或节点获取外呼名单。

Registry SourceRecently Updated
General

Letterboxd Watchlist

Scrape a public Letterboxd user's watchlist into a CSV/JSONL list of titles and film URLs without logging in. Use when a user asks to export, scrape, or mirror a Letterboxd watchlist, or to build watch-next queues.

Registry SourceRecently Updated
General

Seedance Video Generation

Generate AI videos using ByteDance Seedance. Use when the user wants to: (1) generate videos from text prompts, (2) generate videos from images (first frame, first+last frame, reference images), or (3) query/manage video generation tasks. Supports Seedance 1.5 Pro (with audio), 1.0 Pro, 1.0 Pro Fast, and 1.0 Lite models.

Registry SourceRecently Updated
4.2K17jackycser
General

Universal Skills Manager

The master coordinator for AI skills. Discovers skills from multiple sources (SkillsMP.com, SkillHub, and ClawHub), manages installation, and synchronization...

Registry SourceRecently Updated