Academic Paper Analysis

对学术论文（尤其是流行病学、生物统计学、公共卫生方向）进行深度结构化解析。

触发条件

当用户说以下话语时自动激活：

"分析这篇论文"
"对这篇文献进行分析"
"论文分析"
"分析一下这篇文章"
"对这篇xxx进行分析"（xxx为任意文献相关描述）
发送 PDF 附件并要求分析

核心原则

解释优先于罗列。 遇到每一个专业术语、方法名称、缩写时，必须当场解释，不能跳过，不能简单罗列。要说明"这个方法是什么"、"为什么要用"、"它的优缺点是什么"。

解析框架

一、研究设计

对每一个术语逐一解释：

研究类型（如：社区为基础的前瞻性纵向队列研究）→ 什么是队列研究？为什么社区为基础的外推性更强？
纳入/排除标准 → 这两个标准分别解决了什么问题？存在哪些选择偏倚？
随访方式（主动随访 vs 被动随访）→ 两者对失访率的影响？
中位随访时间（median follow-up）和四分位距（IQR）→ 为什么用中位数而非均数？
结局指标的定义 → 如何定义？来自哪些数据来源？是否经过验证？

二、暴露因素/指标构建（如涉及复合指标）

概念解释：这个构念（construct）是什么？能不能直接测量？
代理指标（Proxy Indicator）：为什么用代理？各代理指标的测量方式是什么？
统计方法：如果用了因子分析/潜在类别分析（LCA）/主成分分析（PCA）等降维方法 → 这些方法的核心思想是什么？为什么选择这个方法而非简单相加？
分类阈值：cut-off 值是如何确定的？敏感性如何？

三、统计方法（每个方法都要解释）

对每个统计方法提供：

方法名称 + 全称
这个方法是用来解决什么问题的？
基本原理（用通俗语言）
核心结果的解读方式（如 HR、OR、RR、PD 的区别）
该方法的局限性

常见方法及解释模板：

方法	解释重点
Cox比例风险回归	HR 的含义、比例风险假设是什么
Kaplan-Meier生存分析	生存曲线的读取、中位生存时间
Logistic回归	OR值的含义、优缺点
多状态Markov模型	竞争风险问题、状态转移框架
Laplace回归/分位数回归	为什么要报告绝对效应而不仅是相对效应
潜在类别分析（LCA）	探测性分析方法、与聚类的区别、后验概率
多重插补（MICE）	为什么要插补、插补的假设前提
倾向性评分（PSM/PS分析）	解决混杂的方法、与随机对照试验的区别
交互效应（相乘 vs 相加）	RERI/AP/SI 的公共卫生意义

四、结果呈现

表格的每一列、每一个数字都要有解读：

"这个 HR=0.82 意味着什么？"
"基本调整模型和多因素调整模型的差异说明了什么？"
"置信区间包含1说明什么问题？"

识别并提取表格的布局规范（自动执行）：

看到 Table 1 → 识别行结构（哪些变量、嵌套层次）、列结构（分组数量和排列）、格式规范（连续/分类变量的具体格式）
看到 Table 2/3 → 识别行=结局、列=模型调整层级（基本调整 vs 多因素调整）、格式（HR/CI/Ref 标注方式）
看到亚组分析表 → 识别行=亚组变量、列=暴露分组、末尾有 Interaction P 值列

五、局限性分析

不只列举局限，要说明：

每个局限如何影响结论的可靠性
作者是否在文中采取了相应措施（如敏感性分析）
这些局限是所有同类研究的共性问题还是本研究的特有问题

输出格式

按以下顺序分节输出，每节都要有足够深度和解释：

## 一、研究设计
[详细解析]

## 二、暴露/指标构建方法
[详细解析]

## 三、统计方法
[详细解析]

## 四、研究结果
[详细解析]

## 五、英文原文摘要 + 中文翻译（全文）
[如果论文是英文的，必须提供：Abstract 全文原文 + 完整中文翻译，不删减，不选译]

## 六、讨论部分原文 + 中文翻译（全文）
[如果论文是英文的，必须提供：Discussion 全文原文 + 完整中文翻译，不删减，不选译]

## 七、方法学亮点与局限性
[详细解析]

四-副：图表布局提取（自动存入数据库）

分析论文时，主动识别论文中所有表格，对每个表格提取以下制表逻辑并存入数据库：

对每个识别到的 Table：

表格命名：Table 1、Table 2...
行结构：变量在行里怎么排列（嵌套逻辑、分组方式）
列结构：列与列之间的关系（不同模型 vs 不同暴露组）
变量顺序：变量在行内的排列规则（如人口学→生活方式→代谢指标）
格式规范：
- 连续变量：均值±SD 还是中位数(IQR)？
- 分类变量：n(%) 格式？百分比保留几位小数？
- HR/CI：保留几位小数？Ref 怎么标注？
统计方法：用了什么检验？什么模型？
脚注/注释习惯：作者喜欢在脚注里放什么信息？

存入路径：D:\autoclaw\结果\医学研究方法库\methods.db → table_layouts 表

输出格式

按以下顺序分节输出，每节都要有足够深度和解释：

## 一、研究设计
[详细解析]

## 二、暴露/指标构建方法
[详细解析]

## 三、统计方法
[详细解析]

## 四、研究结果
[详细解析]

## 五、英文原文摘要 + 中文翻译（全文）
[如果论文是英文的，必须提供：Abstract 全文原文 + 完整中文翻译，不删减，不选译]

## 六、讨论部分原文 + 中文翻译（全文）
[如果论文是英文的，必须提供：Discussion 全文原文 + 完整中文翻译，不删减，不选译]

## 七、方法学亮点与局限性
[详细解析]

## 八、图表布局规范（自动存入数据库）
[识别论文中所有 Table，提取每个表格的制表逻辑，逐表列出]

注意事项

收到 PDF 后优先用 PyPDF2（conda 环境）完整读取，再进行分析
不要省略任何一个专业术语的解释
分析要基于原文数据，不要推测
如果论文是英文的，Abstract 和 Discussion 必须提供原文+中文翻译
如果 PDF 是英文的，同时提供英文原术语和中文解释
图表布局提取是自动执行的，不需要用户要求，分析论文时必然执行并写入数据库

academic-paper-analysis

Safety Notice

Copy this and send it to your AI assistant to learn

Academic Paper Analysis

触发条件

核心原则

解析框架

一、研究设计

二、暴露因素/指标构建（如涉及复合指标）

三、统计方法（每个方法都要解释）

四、结果呈现

五、局限性分析

输出格式

四-副：图表布局提取（自动存入数据库）

输出格式

注意事项

Source Transparency

Related Skills

Ephemeral Media Hosting

Ethereum Read Only

OpenClaw Memory

ImageRouter