academic-paper-analysis

对学术论文(流行病学、生物统计学方向)进行深度结构化解析。当用户说"分析这篇论文"、"对这篇文献进行分析"、"论文分析"或类似话语时,自动激活此技能。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "academic-paper-analysis" with this command: npx skills add chircken891/academic-paper-analysis

Academic Paper Analysis

对学术论文(尤其是流行病学、生物统计学、公共卫生方向)进行深度结构化解析。

触发条件

当用户说以下话语时自动激活:

  • "分析这篇论文"
  • "对这篇文献进行分析"
  • "论文分析"
  • "分析一下这篇文章"
  • "对这篇xxx进行分析"(xxx为任意文献相关描述)
  • 发送 PDF 附件并要求分析

核心原则

解释优先于罗列。 遇到每一个专业术语、方法名称、缩写时,必须当场解释,不能跳过,不能简单罗列。要说明"这个方法是什么"、"为什么要用"、"它的优缺点是什么"。

解析框架

一、研究设计

对每一个术语逐一解释:

  • 研究类型(如:社区为基础的前瞻性纵向队列研究)→ 什么是队列研究?为什么社区为基础的外推性更强?
  • 纳入/排除标准 → 这两个标准分别解决了什么问题?存在哪些选择偏倚?
  • 随访方式(主动随访 vs 被动随访)→ 两者对失访率的影响?
  • 中位随访时间(median follow-up)和四分位距(IQR)→ 为什么用中位数而非均数?
  • 结局指标的定义 → 如何定义?来自哪些数据来源?是否经过验证?

二、暴露因素/指标构建(如涉及复合指标)

  • 概念解释:这个构念(construct)是什么?能不能直接测量?
  • 代理指标(Proxy Indicator):为什么用代理?各代理指标的测量方式是什么?
  • 统计方法:如果用了因子分析/潜在类别分析(LCA)/主成分分析(PCA)等降维方法 → 这些方法的核心思想是什么?为什么选择这个方法而非简单相加?
  • 分类阈值:cut-off 值是如何确定的?敏感性如何?

三、统计方法(每个方法都要解释)

对每个统计方法提供:

  1. 方法名称 + 全称
  2. 这个方法是用来解决什么问题的?
  3. 基本原理(用通俗语言)
  4. 核心结果的解读方式(如 HR、OR、RR、PD 的区别)
  5. 该方法的局限性

常见方法及解释模板:

方法解释重点
Cox比例风险回归HR 的含义、比例风险假设是什么
Kaplan-Meier生存分析生存曲线的读取、中位生存时间
Logistic回归OR值的含义、优缺点
多状态Markov模型竞争风险问题、状态转移框架
Laplace回归/分位数回归为什么要报告绝对效应而不仅是相对效应
潜在类别分析(LCA)探测性分析方法、与聚类的区别、后验概率
多重插补(MICE)为什么要插补、插补的假设前提
倾向性评分(PSM/PS分析)解决混杂的方法、与随机对照试验的区别
交互效应(相乘 vs 相加)RERI/AP/SI 的公共卫生意义

四、结果呈现

表格的每一列、每一个数字都要有解读:

  • "这个 HR=0.82 意味着什么?"
  • "基本调整模型和多因素调整模型的差异说明了什么?"
  • "置信区间包含1说明什么问题?"

识别并提取表格的布局规范(自动执行):

  • 看到 Table 1 → 识别行结构(哪些变量、嵌套层次)、列结构(分组数量和排列)、格式规范(连续/分类变量的具体格式)
  • 看到 Table 2/3 → 识别行=结局、列=模型调整层级(基本调整 vs 多因素调整)、格式(HR/CI/Ref 标注方式)
  • 看到亚组分析表 → 识别行=亚组变量、列=暴露分组、末尾有 Interaction P 值列

五、局限性分析

不只列举局限,要说明:

  • 每个局限如何影响结论的可靠性
  • 作者是否在文中采取了相应措施(如敏感性分析)
  • 这些局限是所有同类研究的共性问题还是本研究的特有问题

输出格式

按以下顺序分节输出,每节都要有足够深度和解释:

## 一、研究设计
[详细解析]

## 二、暴露/指标构建方法
[详细解析]

## 三、统计方法
[详细解析]

## 四、研究结果
[详细解析]

## 五、英文原文摘要 + 中文翻译(全文)
[如果论文是英文的,必须提供:Abstract 全文原文 + 完整中文翻译,不删减,不选译]

## 六、讨论部分原文 + 中文翻译(全文)
[如果论文是英文的,必须提供:Discussion 全文原文 + 完整中文翻译,不删减,不选译]

## 七、方法学亮点与局限性
[详细解析]

四-副:图表布局提取(自动存入数据库)

分析论文时,主动识别论文中所有表格,对每个表格提取以下制表逻辑并存入数据库:

对每个识别到的 Table:

  1. 表格命名:Table 1、Table 2...
  2. 行结构:变量在行里怎么排列(嵌套逻辑、分组方式)
  3. 列结构:列与列之间的关系(不同模型 vs 不同暴露组)
  4. 变量顺序:变量在行内的排列规则(如人口学→生活方式→代谢指标)
  5. 格式规范
    • 连续变量:均值±SD 还是 中位数(IQR)?
    • 分类变量:n(%) 格式?百分比保留几位小数?
    • HR/CI:保留几位小数?Ref 怎么标注?
  6. 统计方法:用了什么检验?什么模型?
  7. 脚注/注释习惯:作者喜欢在脚注里放什么信息?

存入路径:D:\autoclaw\结果\医学研究方法库\methods.dbtable_layouts

输出格式

按以下顺序分节输出,每节都要有足够深度和解释:

## 一、研究设计
[详细解析]

## 二、暴露/指标构建方法
[详细解析]

## 三、统计方法
[详细解析]

## 四、研究结果
[详细解析]

## 五、英文原文摘要 + 中文翻译(全文)
[如果论文是英文的,必须提供:Abstract 全文原文 + 完整中文翻译,不删减,不选译]

## 六、讨论部分原文 + 中文翻译(全文)
[如果论文是英文的,必须提供:Discussion 全文原文 + 完整中文翻译,不删减,不选译]

## 七、方法学亮点与局限性
[详细解析]

## 八、图表布局规范(自动存入数据库)
[识别论文中所有 Table,提取每个表格的制表逻辑,逐表列出]

注意事项

  • 收到 PDF 后优先用 PyPDF2(conda 环境)完整读取,再进行分析
  • 不要省略任何一个专业术语的解释
  • 分析要基于原文数据,不要推测
  • 如果论文是英文的,Abstract 和 Discussion 必须提供原文+中文翻译
  • 如果 PDF 是英文的,同时提供英文原术语和中文解释
  • 图表布局提取是自动执行的,不需要用户要求,分析论文时必然执行并写入数据库

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Ephemeral Media Hosting

自動削除機能付き一時メディアホスティングシステム

Registry SourceRecently Updated
General

Ethereum Read Only

Foundry castを使用したウォレット不要のオンチェーン状態読み取り

Registry SourceRecently Updated
General

OpenClaw Memory

Manage, optimize, and troubleshoot the OpenClaw memory system — MEMORY.md curation, daily logs (memory/YYYY-MM-DD.md), memory_search tuning, compaction survi...

Registry SourceRecently Updated
General

ImageRouter

Generate AI images with any model using ImageRouter API (requires API key).

Registry SourceRecently Updated
2.6K2dawe35