Paper Deep Reader — 学术论文深度解读
工作流程
接收用户提供的论文PDF路径后,按以下三阶段顺序执行:
阶段一:图片提取
- 运行图片提取脚本(注意Windows环境使用
py而非python):
py scripts/extract_figures.py "<pdf_path>" -o "<pdf_dir>/figures"
- 用 Read 工具逐一查看提取的图片,建立与论文中 Fig.1, Fig.2, ... 的对应关系
- 记录映射表:
Fig.X → pageY_imgZ_WxH.ext
判断技巧:
- 按页码顺序浏览,大尺寸图片通常是正式Figure
- 小图标(<200px)、期刊logo通常可忽略
- 同一页多张图片按面积从大到小排列,最大的通常是主图
阶段二:撰写深度解读Markdown
- 用 Read 工具读取PDF内容
- 参考
references/analysis-template.md中的四轮结构和图表分析规范 - 撰写完整的中文深度解读文档,要求:
- 严格遵循四轮解读结构(摘要引言→方法→结果讨论→结论展望)
- 所有重要图表必须插入图片引用
并附带五维分析(类型、内容、趋势、数据、结论) - 关键数据用表格呈现
- 末尾包含全文总评(优势、不足、启示)
- 用 Write 工具保存到
<pdf_dir>/论文深度解读_<简短标题>.md
阶段三:转换飞书文档
使用 mcp__docparser__parse_markdown 工具将Markdown转为飞书文档:
工具: mcp__docparser__parse_markdown
参数: resourceUri = "file:///<markdown文件绝对路径>"
将返回的飞书文档链接提供给用户。
输出清单
完成后向用户确认以下交付物:
figures/目录 — 提取的论文图片论文深度解读_XXX.md— 带图片引用的完整解读文档- 飞书文档链接 — 在线可分享版本
注意事项
- 图片在飞书中显示取决于路径可访问性;如飞书中图片未显示,提醒用户可在本地Markdown中查看
- 对于超长论文(>20页),可适当精简非核心章节,但四轮结构不可省略
- 图表分析是核心价值,宁可文字精简也不可省略图表分析
- 所有输出始终使用中文