paper-review-generator

将论文 PDF 批处理为中文精读总结报告的工作流技能。适用于“PaddleOCR 或 pdfplumber 抽取文本 + 大模型总结论文”场景。使用时仅读取 skill 目录下 config.json 与 prompt.md,并运行 scripts 中所需脚本,用户可在prompt.md中定义用户研究主题与研究方向。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "paper-review-generator" with this command: npx skills add mxingchtongaelofficial2568/llm-paper-review-generator

paper-review-generator

1) 配置文件约束

  • 仅使用当前 skill 目录下两个文件:
    • config.json:包含运行所需全部信息(是否 OCR、OCR 参数、总结模型 base_url/model/api_key、可见窗口开关、线程数)
    • prompt.md:总结提示词模板
  • api_key 支持两种写法:
    • 在config.json中指定
    • 环境变量引用:${ENV_VAR},脚本会在运行时读取对应环境变量
  • 不读取其他目录 secret。
  • 不在日志和异常信息中回显任何 api_key 或 token。

2) 执行入口

  • 必须先切换到本 skill 根目录再运行脚本(即 .../paper-review-generator),否则相对路径的 config.json / prompt.md 会找不到。
  • 必须由用户明确传入输入与输出路径:
    • --pdf(可重复,支持多个文件)
    • --dir(可重复,支持多个文件夹)
    • --output-dir(可选;不传时默认输出到每个输入 PDF 同目录下的 总结 文件夹)
  • 示例(路径由 agent 按用户需求填入):
    • 单文件:python scripts/run_pipeline.py --pdf "{pdf_path}" --output-dir "{output_dir}"
    • 多文件:python scripts/run_pipeline.py --pdf "{pdf_path_1}" --pdf "{pdf_path_2}" --output-dir "{output_dir}"
    • 单文件夹:python scripts/run_pipeline.py --dir "{pdf_dir}" --output-dir "{output_dir}"
    • 多文件夹:python scripts/run_pipeline.py --dir "{pdf_dir_1}" --dir "{pdf_dir_2}" --output-dir "{output_dir}"

3) 分流逻辑

  • 读取 config.json.use_paddleocr
    • true:调用 extract_paddleocr.py 抽取文本(JSON 行输出,不落盘)。
    • false:调用 extract_pdfplumber.py 抽取文本(JSON 行输出,不落盘)。
  • 然后调用 summarize_reports.py:读取 prompt.md 与管道传递的抽取文本,调用 summarizer.provider 指定的模型配置生成 *_研读报告.md

4) 环境检查与安全规范

  • 执行前先检查 Python 是否可用(建议 3.10+):
    • 若用户电脑未安装 Python,必须先明确提示用户安装 Python,再继续后续步骤。
  • 执行前检查依赖:
    • 若缺少依赖包,agent 应在 skill 根目录按 scripts/requirements.txt 执行安装:
      • pip install -r scripts/requirements.txt
  • 首次使用前必须做端点审查:
    • 只保留你信任的 provider,删除或留空不用的 base_url/model
    • 敏感文档场景优先使用自建/内网 OCR 与 LLM 端点
  • 仅向用户明确确认过的 OCR/LLM 端点发请求。
  • 若配置缺失(如 api_key/token/model/base_url),直接报错并提示补齐字段。
  • 日志与异常必须脱敏,禁止输出原始 Authorization/API key/token 或完整远端响应体。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

AI Product Manager

OpenClaw-first AI product manager for turning analytics, revenue, crash, store, and feedback signals into execution-ready proposals and backlog work.

Registry SourceRecently Updated
General

Startup Verifier

Проверяет стартапы по 14 критериям для адаптации на российский рынок и выдает вердикт: GREEN, YELLOW или RED.

Registry SourceRecently Updated
General

Red Team Verificator

Аудит стратегических анализов стартапов с фокусом на поиск ошибок, галлюцинаций и искажений в данных и Red Team-отчетах.

Registry SourceRecently Updated
General

Startup Pipeline

Systematic multi-step pipeline for sourcing, analyzing, verifying, and adapting Western PMF startups to the Russian market with competitor and market filters.

Registry SourceRecently Updated