Paper Analysis — 一键深度分析一篇论文

输入论文 URL、PDF 路径或标题，自动并行采集七个维度的信息，交叉分析后输出结构化研究笔记。

When to Use

当用户请求以下操作时触发：

"分析这篇论文 https://arxiv.org/abs/..." / "分析 xxx 论文"
"paper analysis: Attention Is All You Need"
"读这篇 paper" / "帮我分析下这篇论文"
"这篇论文讲什么" / "论文笔记 xxx"

来源可信度规则（全局，所有 Phase/Agent 均适用）

一手源优先原则

论文原文是唯一的事实权威。所有关键数字、方法描述、实验结果必须能在论文原文中定位到具体章节/图表/公式。外部来源仅用于补充解读和社区反馈。

来源分层

层级来源类型用途标注要求

L1 一手源论文原文（arXiv HTML/PDF）、会议官方页（USENIX/ACM/IEEE/NeurIPS）、作者主页关键事实、数字、方法描述标注 Section/Figure/Table 编号

L2 强可信 Google Scholar、Semantic Scholar、DBLP、OpenReview 官方评审、实验室主页引用量、h-index、评审意见标注页面 URL + 抓取日期

L3 补充解读知名技术博客（如作者本人博客、机构官方博客）、学术社区讨论（Reddit/Twitter 原帖）社区反馈、通俗解读明确标注为"外部解读"，不作为事实依据

L4 低可信新闻稿、聚合站、媒体转述、交易所/营销类网站不得用于支撑关键事实，仅可在社区反馈维度作为"舆情信号"引用标注"低可信来源"

段内引用与断言标注

禁止"末尾堆链接"模式。所有关键断言必须在行文中就地标注来源：

论文原文事实：（论文 Section 3.2, Figure 4）
外部可验证数据：（Google Scholar, 2026-03-14 抓取, 1,234 citations）
外部解读：（来源名称, 外部解读）
分析者推断：必须用"分析认为"/"推断"等措辞标记，不得伪装为事实
时间敏感指标（引用量、star、upvote）：必须标注抓取日期 + 来源 URL；无法从 L1/L2 获取则不写数字，改为"截至 {date} 未找到可靠公开数据"

Phase 0: 论文定位与输入解析

硬约束（不可跳过）: 禁止检测本地是否存在已有分析文件。无论工作目录下有无同名或相似文件，都必须从头执行完整分析流程，重新生成报告。

根据用户输入，识别输入类型并执行对应流程：

输入路径

输入类型处理流程

URL WebFetch 抓取页面，提取标题、作者、摘要、机构

PDF 路径 Read 读取 PDF 前几页，提取标题、作者、摘要

标题/关键词 WebSearch 搜索定位，再 WebFetch 获取详情

URL 输入处理

arXiv 链接

Step 1: WebFetch https://arxiv.org/abs/{id} → 提取标题、作者、摘要、提交日期 Step 2: 尝试 WebFetch https://arxiv.org/html/{id} 获取论文 HTML 全文（用于后续 Agent 引用具体章节） Step 3: WebSearch "{paper_title} conference accepted" 或 "{paper_title} published venue" → 确认发表会议/期刊

其他 URL（Semantic Scholar、ACL Anthology、OpenReview 等）

WebFetch {url} → 提取标题、作者、摘要、机构、venue

PDF 输入处理

Read {pdf_path} (前 5 页) → 提取标题、作者、摘要、机构 → 记录论文结构（章节标题列表）供后续引用 → 如信息不全，WebSearch "{提取到的标题}" 补充

标题/关键词输入处理

Step 1: WebSearch "{论文标题/关键词} arxiv OR paper OR conference" → 找到论文链接 Step 2: WebFetch {找到的链接} → 提取完整信息 Step 3: 如果找到 arXiv 链接，尝试获取 HTML 全文

如果搜索结果不明确，向用户确认后再继续。

获取论文原文（关键步骤，不可跳过）

在进入 Phase 1 之前，必须尝试获取论文原文内容作为一手事实源：

arXiv HTML（首选）：WebFetch https://arxiv.org/html/{id} — 获取结构化全文
PDF：如果用户提供了 PDF 路径，Read {pdf_path} 读取全文
会议官方页面：WebFetch {conference_url} — 部分会议提供 HTML 版本

将获取到的论文原文内容（或关键章节摘要）存入 {paper_content} 变量，传递给每个 Agent。如果无法获取全文，在 {paper_content} 中标注"未获取到论文全文，Agent 需通过搜索补充"。

生成论文定位映射（必须，不可跳过）

从 {paper_content} 中提取论文的结构骨架，生成 {paper_locator_map} ，后续所有 Agent 必须引用此 map 中的编号：

从论文原文中提取：

Section 编号与标题（如 "Section 3.2: DualPath Architecture"）
所有 Figure 编号与标题（如 "Figure 3: System overview"）
所有 Table 编号与标题（如 "Table 2: Offline throughput comparison"）
所有 Algorithm 编号与标题（如有）
References 中被引用 ≥ 2 次的前置论文编号与标题

输出格式：

paper_locator_map

Sections

Section 1: Introduction
Section 2: Background
Section 3: Method
- Section 3.1: ...
- Section 3.2: ...
...

Figures

Figure 1: ...
Figure 2: ...

Tables

Table 1: ...
Table 2: ...

Key References

[12] Attention Is All You Need (Vaswani et al., 2017)
[15] ...

如果论文 HTML 无编号（部分 arXiv 论文），用 Section 标题作为定位锚点（如 "Evaluation > Offline Throughput" ）。

此步骤的输出 {paper_locator_map} 必须传给每个 Agent，作为引用时的"合法编号列表"。Agent 引用的 Section/Figure/Table 编号必须来自此 map。

确定关键变量

以下变量后续所有 Agent 都需要用到：

{paper_title} — 完整论文标题
{authors} — 作者列表
{institution} — 机构/团队
{year} — 发表年份
{venue} — 发表会议/期刊（未发表则标注 arXiv preprint）
{abstract} — 摘要
{paper_content} — 论文原文内容或关键章节（作为一手事实源传给每个 Agent）
{paper_locator_map} — 论文结构骨架（Section/Figure/Table/Algorithm 编号列表，Agent 引用必须来自此 map）
{paper_type} — 论文类型（学术论文 / 技术报告 / 白皮书）
{lang} — 输出语言（用户指定或默认中文）
{date} — 分析日期，格式 YYYY-MM-DD
{paper_name_en} — 英文文件名形式（小写、连字符分隔）

论文类型适配提示

传给每个子代理：

学术论文 → "这是学术论文，侧重分析研究方法、实验设计、理论贡献"
技术报告 → "这是技术报告，侧重分析系统设计、工程实践、性能指标"
白皮书 → "这是白皮书，侧重分析行业洞察、方案设计、商业价值"
Survey/综述 → "这是综述论文，侧重分析分类框架、研究脉络、未来方向"

如果无法确定论文类型或关键信息，先用一次 WebSearch 快速查询，不要跳过这一步。

Phase 1: 并行数据采集 (7 个 Subagent)

关键要求: 以下 7 个 Agent 必须放在同一条消息中发出，确保并行执行。

每个 Agent 使用 subagent_type: "general-purpose" 。

全局 Agent 指令分为两部分，分别放在每个 Agent prompt 的开头和末尾：

{前置引用约束}（放在每个 Agent prompt 的任务描述之前，作为硬约束前置）：

硬约束（违反将导致输出被丢弃）

可用的论文定位编号: {paper_locator_map} 你引用的 Section/Figure/Table 编号必须来自上述 map，不得编造不存在的编号。

每个关键数字/断言后必须就地括号标注论文位置: （论文 Section X.Y, Table/Figure Z）
- ✅ 离线吞吐提升 1.87×（论文 Table 2, Section 5.1）
- ❌ 离线吞吐提升 1.87×（来源: arxiv html）
- ❌ 离线吞吐提升 1.87× （无标注）
- ❌ 段落末尾统一放一个链接或"参见论文 Section 5" — 这是段末堆链接，不算引用
- HTML 无编号时用 Section 标题: （论文 "Evaluation > Offline Throughput"）
非数字的技术断言也需标注：具体机制（如"使用 RDMA 直接传输"）、设计决策（如"采用 io_uring 旁路内核"）、性能特征（如"近线性扩展"）→ 必须标注论文中描述该机制的 Section/Figure
L4 来源（新闻稿/聚合站/交易所）不得支撑任何事实断言
无法定位到论文具体位置的数字或技术细节 → 不写，改为定性描述或省略
分析推断必须用"分析认为/推断"标记

{输出格式要求}（放在每个 Agent prompt 的末尾）：

来源与引用规则（必须遵守）

一手源优先：论文原文是唯一事实权威。关键数字和方法描述必须能定位到论文的具体 Section/Figure/Table。
段内引用：每个关键断言后必须括号标注来源，格式：
- 论文原文：（论文 Section X.Y, Figure Z）
- 外部验证数据：（来源名, URL, 抓取日期）
- 外部解读：（来源名, 外部解读）
来源分层：
- L1（论文原文、会议官方页、作者主页）→ 可支撑关键事实
- L2（Google Scholar、Semantic Scholar、OpenReview）→ 可支撑引用量等指标
- L3（技术博客、社区讨论）→ 仅作补充解读，标注"外部解读"
- L4（新闻稿、聚合站）→ 不得用于关键事实
不确定就不写：无法从 L1/L2 来源验证的具体数字，不写数字，改为"未找到可靠数据"。
区分事实与推断：论文原文事实直接陈述；分析者推断必须用"推断/分析认为"标记。
字数上限 800 字：超出时优先保留有一手源支撑的内容，砍掉无法验证的描述。

必须的输出格式

在你的分析文本之后，必须附加一个断言-位置映射表:

断言-位置映射

断言/数字	论文位置	来源层级
{每个关键数字或事实断言}	Section X, Table Y / 来源URL	L1/L2/L3/L4

要求: 至少覆盖你输出中的所有阿拉伯数字。无法定位的填"未定位"。

Agent 1: 背景与动机

description: "研究{paper_title}背景与动机"

prompt 模板:

{前置引用约束}

你是学术研究分析专家。请研究论文《{paper_title}》（{authors}, {year}）的研究背景与动机。

论文摘要：{abstract} 论文原文（如有）：{paper_content} 论文定位映射：{paper_locator_map} 论文类型提示：{type_hint} 输出语言：{lang}

任务:

优先从论文原文提取：从 {paper_content} 中定位 Introduction / Related Work 部分，提取：
- 研究领域现状和前人工作
- 核心问题和动机
- 标注具体 Section 编号
使用 WebSearch 搜索补充信息（至少 1 次）:
- "{paper_title} motivation background related work" → 补充论文未明确说明的领域背景
使用 WebFetch 访问至少 1 个 L1/L2 来源页面验证

整理以下信息:

研究领域现状:

该领域的发展脉络和现状（标注信息来源）
前人工作的主要贡献和局限（标注论文 Section）

核心问题与动机:

论文要解决的核心问题（标注论文 Section）
现有方法为什么不够好（标注论文中的论据）
作者的切入角度和研究假设

{输出格式要求}

Agent 2: 团队与作者背景

description: "研究{paper_title}团队背景"

prompt 模板:

{前置引用约束}

本 Agent 专属约束

禁止来源: 36kr、ResearchGate、新闻稿、媒体报道 — 不得作为团队背景的任何支撑
入职时间、实习经历等履历细节 → 除非作者主页明确写明，否则不写（不是标"待核实"，是不写）
每条断言标注具体来源页面路径（如 "xinjin.github.io > Publications"），不得笼统写"来源: 作者主页"
禁止定性评价: "最具影响力""核心人物""标志性学者""领军团队"等 → 除非有官方奖项/头衔页面支撑，否则不写
宁缺毋滥: 若无法从作者主页/Scholar/DBLP 验证，整段缩减为"作者所属机构 + 与本文直接相关的 1-2 篇前序工作"，禁止补充履历叙事。信息不足时本维度压缩为 2-4 句即可

你是学术情报分析专家。请研究论文《{paper_title}》作者团队的背景信息。

作者列表：{authors} 机构：{institution} 输出语言：{lang}

任务:

使用 WebSearch 搜索以下关键词（至少搜 2 次不同关键词）:
- "{第一作者} {institution} research site:scholar.google.com OR site:dblp.org OR site:semanticscholar.org"
- "{通讯作者} homepage OR lab"
使用 WebFetch 访问至少 1 个作者主页、Google Scholar 或 DBLP 页面（仅 L1/L2 来源）

整理以下信息:

核心作者介绍:

第一作者和通讯作者的背景（职位、研究方向、代表作）
所属机构/实验室的研究特色
仅列出可从官方主页或 Google Scholar 确认的荣誉/奖项
无法从 L1/L2 来源验证的信息 → 不写（不是标"待核实"）

研究脉络:

团队在该领域的前序工作（列出具体论文名称和会议）
与本论文的延续/突破关系

特别注意: 团队背景是最容易出现幻觉的维度。

所有奖项、项目归属、影响力定性（如"最具影响力"）必须有 L1/L2 来源支撑，否则不写
入职时间、实习经历、组织归属等履历细节幻觉风险极高，除非在作者主页或论文首页明确写明，否则不写

{输出格式要求}

Agent 3: 技术方法与创新点

description: "分析{paper_title}技术方法"

prompt 模板:

{前置引用约束}

你是技术方法分析专家。请分析论文《{paper_title}》（{authors}, {year}）的核心技术方法和创新点。

论文摘要：{abstract} 论文原文（如有）：{paper_content} 论文定位映射：{paper_locator_map} 论文类型提示：{type_hint} 输出语言：{lang}

任务:

优先从论文原文提取：从 {paper_content} 中定位 Method / Approach / System Design 部分，提取：
- 核心方法/算法/架构
- 关键技术组件和工作流程
- 与前人工作的区别（论文中的 comparison）
- 标注具体 Section/Figure/Algorithm 编号
使用 WebSearch 搜索补充解读（至少 1 次）:
- "{paper_title} method explained" 或 "{paper_title} 方法解析" → 获取通俗解读作为补充（标注为 L3 外部解读）
使用 WebFetch 访问至少 1 个技术解读页面

整理以下信息:

核心方法:

论文提出的核心方法/算法/架构（标注论文 Section/Figure）
关键技术组件和工作流程
数学/算法层面的核心思想（用直觉解释，避免纯公式）

创新点:

与前人工作的关键区别（列 2-3 点，标注论文中的论据）
每个创新点为什么重要
技术贡献的本质（新架构 / 新训练策略 / 新理论框架等）

{输出格式要求}

Agent 4: 实验与结果评估

description: "分析{paper_title}实验结果"

prompt 模板:

{前置引用约束}

你是实验评估专家。请分析论文《{paper_title}》（{authors}, {year}）的实验设计和结果。

论文摘要：{abstract} 论文原文（如有）：{paper_content} 论文定位映射：{paper_locator_map} 论文类型提示：{type_hint} 输出语言：{lang}

任务:

必须从论文原文提取：从 {paper_content} 中定位 Experiments / Evaluation / Results 部分，提取：
- 实验设置（数据集、基线、指标）
- 关键结果数字（标注具体 Table/Figure 编号）
- 消融实验发现
使用 WebSearch 搜索补充（至少 1 次）:
- "{paper_title} results benchmark comparison" → 了解社区对实验结果的评价
使用 WebFetch 访问至少 1 个 L1/L2 来源验证

整理以下信息:

实验设计:

使用的数据集/基准（标注论文 Section）
基线方法（baseline）有哪些
评估指标

关键结果:

主要实验结果（标注论文 Table/Figure 编号）
与 baseline 的关键对比数字
消融实验的主要发现（如有，标注 Table/Figure）
结果是否充分验证了论文的核心 claim

特别注意: 实验数字是最需要精确的内容。所有数字必须能在论文原文的具体 Table/Figure 中找到，不得从博客或新闻稿中提取实验数据。

{输出格式要求}

Agent 5: 优缺点与局限性

description: "分析{paper_title}优缺点"

prompt 模板:

{前置引用约束}

你是学术评审专家。请分析论文《{paper_title}》（{authors}, {year}）的优缺点和局限性。

论文摘要：{abstract} 论文原文（如有）：{paper_content} 论文定位映射：{paper_locator_map} 论文类型提示：{type_hint} 输出语言：{lang}

任务:

优先从论文原文提取：从 {paper_content} 中定位 Discussion / Limitations / Conclusion 部分，提取：
- 作者自述的局限性（标注 Section）
- 作者讨论的适用边界
使用 WebSearch 搜索以下关键词（至少搜 2 次不同关键词）:
- "{paper_title} limitations criticism"
- "{paper_title} review openreview" 或 "{paper_title} 不足局限"
使用 WebFetch 访问至少 1 个包含论文评价的页面（优先 OpenReview 官方评审）

整理以下信息:

优点:

方法论层面的优点（2-3 点，标注论文中的支撑）
实验层面的优点

局限性:

作者自述的局限（标注论文 Section，这是最可靠的）
外部评审/社区指出的不足（标注来源和层级）
方法的适用边界和前置条件

改进方向:

可能的改进思路（1-2 点）

{输出格式要求}

Agent 6: 社区反馈与影响力

description: "研究{paper_title}社区影响"

prompt 模板:

{前置引用约束}

你是学术影响力分析专家。请研究论文《{paper_title}》（{authors}, {year}）的社区反馈和学术影响力。

论文摘要：{abstract} 输出语言：{lang}

任务:

使用 WebSearch 搜索以下关键词（至少搜 2 次不同关键词）:
- "{paper_title} site:scholar.google.com OR site:semanticscholar.org"
- "{paper_title} github implementation" 或 "{paper_title} discussion reddit twitter"
使用 WebFetch 访问：
- 必须: 至少 1 个 L2 来源（Google Scholar 或 Semantic Scholar）获取引用数据
- 可选: 社区讨论页面

整理以下信息:

学术影响力:

引用量（标注来源 + 抓取日期，如"Google Scholar, {date}, N citations"）
被哪些重要后续工作引用（列出具体论文名称）
是否获得最佳论文奖（仅从会议官方页面确认，无法确认则不写）

社区反馈:

业界/学界的主要评价（标注来源层级）
开源实现情况（GitHub URL + star 数 + 抓取日期）
工业界采用情况（仅写有 L1/L2 来源支撑的）
争议或批评（标注来源）

特别注意:

本维度信息时效性最强，所有数字指标必须标注抓取日期和来源 URL
新论文（发布 < 6 个月）社区反馈可能不充分，如实标注"论文较新，数据有限"，不要编造
L4 来源（新闻稿/聚合站）仅可作为"舆情信号"引用，不可作为事实依据，且必须标注"L4 低可信"
禁止从 L4 来源提取引用量、star 数等数字指标

{输出格式要求}

Agent 7: 术语表与延伸阅读

description: "整理{paper_title}术语与延伸阅读"

prompt 模板:

{前置引用约束}

你是学术知识整理专家。请整理论文《{paper_title}》（{authors}, {year}）的关键术语和推荐延伸阅读。

论文摘要：{abstract} 论文原文（如有）：{paper_content} 论文定位映射：{paper_locator_map} 论文类型提示：{type_hint} 输出语言：{lang}

任务:

优先从论文原文提取：从 {paper_content} 中提取：
- 论文定义或频繁使用的关键术语
- References 部分引用的核心论文
使用 WebSearch 搜索补充（至少 1 次）:
- "{paper_title} related papers survey" → 了解该方向的前置和后续工作
使用 WebFetch 访问至少 1 个 L1/L2 来源验证

整理以下信息:

术语索引表:

列出论文中 10-15 个关键术语/概念
每个条目包含: 术语名称、简要定义（1-2 句）
优先提取论文中有明确定义的术语（标注 Section）
标注术语之间的关联关系

延伸阅读:

前置阅读（理解本文需要先读的 2-3 篇论文，必须从论文 References 中选取，标注引用编号如 [12]）
后续工作（基于本文的重要后续研究 3-4 篇，必须通过 WebSearch/WebFetch 确认真实存在）
每篇包含: 标题、作者、年份、与本文的关联说明、来源（论文 References [N] / Google Scholar / Semantic Scholar）
不得列出无法通过搜索确认的论文——如果搜索不到，就不列

{输出格式要求}

Phase 2: 综合分析 (主线程)

等待 7 个 Agent 全部返回后，在主线程中完成以下分析。

Step 1: 信息汇总与事实校验

将 7 个 Agent 的结果整合，执行：

来源层级审查：检查各 Agent 返回的断言是否有合格来源支撑，将仅有 L4 来源支撑的"事实"降级为"待验证"
一致性信号：多个 Agent 从不同来源提到同一结论 = 高置信度
补充关系：Agent 1 的动机与 Agent 3 的方法形成问题→方案对应
矛盾信号：不同来源对某观点评价不一致 = 在报告中标注争议
整理所有来源 URL，按层级分类

Step 1.5: 论文位置映射表（硬门控）

从所有 Agent 返回的"断言-位置映射表"中汇总，合并去重。然后按以下规则分类处理：

合格条目（有 Section/Table/Figure 编号）: 直接进入报告
仅有 URL 无编号的条目: 回到 {paper_content} 全文搜索定位，补上编号
搜索后仍无法定位的条目: 标注"位置待定"，在报告中该数字改为定性描述（如"显著提升"替代具体倍数）
来自 L4 来源的条目: 从事实段落移除，仅可在社区反馈段引用

汇总格式：

数字/断言	论文位置	来源 Agent	状态
1.87× 离线吞吐提升	Table X, Section Y	Agent 4	合格
28.8× 算力增长	Section 1, Figure Z	Agent 1	合格
某个数字	未定位	Agent 3	降级为定性描述
...	...	...	...

门控条件: 合格条目 < 10 条时，说明论文原文提取不充分，需要重新 WebFetch 论文 HTML 并补充定位，而非直接进入 Phase 3。

Step 2: 交叉关联

在 7 个维度之间建立关联：

动机 ↔ 方法映射: 将背景问题（Agent 1）与技术方案（Agent 3）一一对应
方法 ↔ 实验验证: 检查创新点（Agent 3）是否在实验（Agent 4）中得到充分验证
优缺点 ↔ 社区反馈: 对比作者自述局限（Agent 5）与社区评价（Agent 6）是否一致
团队背景 ↔ 研究脉络: 将团队前序工作（Agent 2）与本文的延续/突破关系标注
术语 ↔ 内容锚定: 验证术语（Agent 7）与各维度内容的对应关系

Step 3: 核心结论提炼

基于以上分析，撰写 3-5 句话的核心结论：

这篇论文最核心的贡献是什么
最值得关注的 1-2 个创新点
实际影响和应用价值
最适合什么样的读者

Phase 3: 输出报告

按以下 Markdown 格式输出最终报告：

《{paper_title}》论文深度分析

作者: {authors} | 机构: {institution} | 发表: {venue} {year} | 分析日期: {date}

核心结论

核心贡献: {一句话}（论文 Section X, Table/Figure Y）
关键创新: {一句话}（论文 Section X）
关键结果: {一句话，含数字}（论文 Table X, Section Y）
适合读者: {一句话}
局限提示: {一句话}（论文 Section X）

一、背景与动机

研究领域现状

{该领域的发展脉络和现状，前人工作的贡献与局限} {每个关键断言后标注来源，如（论文 Section 1, [2]）}

核心问题与动机

{论文要解决的核心问题、现有方法的不足、作者的切入角度} {标注论文 Section}

二、团队与作者背景

核心作者

{第一作者和通讯作者的背景、研究方向、代表作} {所有荣誉/奖项标注验证来源（具体页面路径），无法从 L1/L2 验证的不写}

研究脉络

{团队前序工作与本文的关系、实验室研究特色}

三、技术方法与创新点

核心方法

{论文提出的核心方法/算法/架构（标注论文 Section/Figure）} {关键技术组件和工作流程，每个组件标注论文 Section}

创新点

{创新点一}: {描述及为什么重要}（论文 Section X.Y）
{创新点二}: {描述及为什么重要}（论文 Section X.Y）
{创新点三}: {描述及为什么重要}（论文 Section X.Y）

四、实验与结果评估

实验设计

项目	详情	论文位置
数据集	{使用的数据集/基准}	Section X（不可为空）
基线方法	{baseline 列表}	Section X（不可为空）
评估指标	{主要指标}	Section X（不可为空）

关键结果

{指标名}: {数字}（论文 Table X, Section Y）
{指标名}: {数字}（论文 Table X, Section Y）
{指标名}: {数字}（论文 Figure X, Section Y）
...

消融实验

{消融变量}: {去掉后的数字变化}（论文 Table X）
{消融变量}: {去掉后的数字变化}（论文 Table X）
...

五、优缺点与局限性

优点

{方法论和实验层面的优点，标注论文支撑}

局限性

{作者自述局限（标注论文 Section）、社区指出的不足（标注来源层级）、适用边界}

改进方向

{可能的改进思路}

六、社区反馈与影响力

学术影响力

{引用量（来源 + 抓取日期）、重要后续工作、获奖情况（仅官方确认的）}

社区反馈

已验证事实:

{可独立验证的客观信息，如平台收录、讨论帖链接、开源仓库 URL + star + 抓取日期}

外部讨论:

{来自社区的具体评论或观点}（来源层级, URL）

分析判断:

分析认为：{基于以上事实的推理和综合判断}

七、术语表与延伸阅读

术语索引

术语	定义	论文位置
{术语1}	{简要定义}	Section X（不可为空）
{术语2}	{简要定义}	Section X（不可为空）
...	...	...

延伸阅读

前置阅读（理解本文的基础）:

论文	作者	年份	关联说明	来源
{论文1}	{作者}	{年份}	{与本文的关联}	References [N]

后续工作（已发表的相关研究）:

论文	作者	年份	关联说明	来源
{论文1}	{作者}	{年份}	{与本文的关联}	Google Scholar / Semantic Scholar

潜在研究方向（未发表/作者设想）:

{方向1}：{简要描述}（来源：论文 Section X / 作者公开讨论）
{方向2}：{简要描述}

论文定位映射（paper_locator_map）

{paper_locator_map 原文}

断言与证据清单

#	关键断言	论文位置（须匹配 paper_locator_map）	外部来源	来源层级	置信度	性质
1	{断言描述}	Section X, Table Y	—	L1	High	论文原文
2	{断言描述}	—	{URL, 抓取日期}	L2	Medium	外部验证
3	{断言描述}	—	—	—	Low	分析推断
...	...	...	...	...	...	...

置信度说明：High = L1 来源直接支撑；Medium = L2 来源支撑或多个 L3 来源交叉验证；Low = 仅有 L3/L4 来源或为分析推断 审计方法: "论文位置"列中的每个 Section/Table/Figure 编号必须能在上方 paper_locator_map 中找到对应条目。找不到 → 该行标红待查。

来源登记表

#	来源	层级	用于支撑	抓取日期
1	论文原文: {paper_title}	L1	方法、实验、局限性	—
2	{作者主页 URL}	L1	团队背景	{date}
3	{Google Scholar URL}	L2	引用量	{date}
4	{技术博客 URL}	L3	外部解读	{date}
...	...	...	...	...

L4 来源不得出现在此登记表中。 如需引用 L4 来源，仅可在正文"社区反馈 > 外部讨论"中内联标注 （L4 低可信），不登记。常见 L4 来源：bitcoinethereumnews.com、aihaberleri.org、MEXC News、36kr、新浪科技、coindesk（非技术原文时）。

本笔记由 AI 自动生成。关键数字和事实已尽量标注论文原文位置，建议结合原文验证。"断言与证据清单"可快速定位需要核查的内容。

Phase 3.5: 报告校验与修复（写入文件前必须执行，不可跳过）

Step 1: 断言引用扫描

逐行扫描报告，对每个阿拉伯数字和每个具体技术机制描述:

紧跟（论文 Section/Table/Figure X）且编号存在于 paper_locator_map → 通过
段落末尾有链接但数字/断言本身无标注 → 不合格（这是"段末堆链接"反模式）→ 把标注移到数字/断言后面
有 URL 但无 Section 编号 → 回到 Step 1.5 映射表查找，补上编号或改为定性描述
无任何标注 → 补上标注或删除该数字/断言

必须捕获的不合格模式（逐字符扫描以下 pattern）:

Table 或 Figure 后无编号 → 补编号或改为 Section 引用
论文 Table, Section X — Table 缺编号（逗号前应为 Table N ）→ 补上 Table 编号或仅保留 Section
（论文 Section X）中 X 不在 paper_locator_map → 回查论文，修正编号或标"未定位"
（来源: arxiv html）或（来源: 论文） — 这不是定位引用 → 替换为具体 Section/Table 编号
引用的 Table/Figure 编号在 paper_locator_map 中不存在 → 回查论文或删除该引用

扫描范围特别关注：核心结论、关键结果、消融实验、技术方法中的具体机制名称

Step 2: 来源层级执行

逐行扫描报告全文（不仅是"来源:"行），搜索以下 L4 域名关键词:

36kr / ResearchGate / MEXC / aihaberleri / bitcoinethereumnews / Eyerys / 新浪科技 / coindesk / techcrunch （非第一手技术文章时）
上述域名出现在团队背景、技术方法、实验评估、优缺点段落 → 移除该来源支撑的断言，或将断言移入"社区反馈 > 外部讨论"并标（L4 低可信）
上述域名出现在参考来源区 → 移除，L4 不入参考来源区

Step 3: 结构完整性

实验设计表有"论文位置"列且非空
术语索引表有"论文位置"列且非空
社区反馈分为: 已验证事实 / 外部讨论 / 分析判断
来源登记表存在，每行有层级和"用于支撑"列，无 L4 来源
断言与证据清单存在且 ≥ 10 条

Step 4: 团队背景审查

无 36kr/ResearchGate/媒体稿来源
无法从作者主页/Scholar 直接证实的履历细节 → 删除（不是标"待核实"）
"据报道"/"据...报道"/"reported"/"据媒体"/"有报道称" → 如紧跟内容无 L1/L2 来源括号标注 → 删除整句（"据报道"本身就是 L4 信号词）
具体硬件采购数量（如"采购 N 块 GPU"）→ 除非来源为公司官方公告或 SEC 文件 → 删除

Step 5: 其他校验

推断有标记: 比较级/评价性表述（"较快""显著""典范"）标注了来源，或用"分析认为"标记
延伸阅读: 前置阅读必须来自论文 References（标注 [N]）；后续工作必须有来源列（Google Scholar / Semantic Scholar）；无法确认存在的条目删除
时间敏感指标: 引用量/star/upvote 标注抓取日期和来源 URL
无占位符/编造 URL: 所有来源链接真实可访问

Step 6: 未通过项降级（不修复就降级，不降级就删除）

Step 1-5 中发现的未通过项，按以下规则强制降级：

关键数字无论文位置 → 删除数字，改为定性描述（如"显著提升"）
技术断言无论文位置 → 删除该断言，或加"分析认为"标记降级为推断
团队背景仅有 L3/L4 来源 → 删除该断言，整段压缩为"信息不足"
团队背景使用定性评价（"最具影响力""核心人物"等）且无官方奖项支撑 → 删除
社区观点仅有 L4 来源 → 改写为"有媒体报道该工作"，不得归纳行业评价
延伸阅读无法确认存在 → 删除该条目

Step 7: 证据覆盖率检查（最终门控）

统计以下指标，未达标则不允许输出最终报告：

阿拉伯数字覆盖率: 正文中所有阿拉伯数字必须 100% 进入"断言与证据清单"。未达标 → 补齐后再输出
核心结论 L1 覆盖: 核心结论的 5 条中至少 3 条有 L1 来源支撑。未达标 → 重写核心结论，删除无 L1 支撑的条目
实验数字定位率: 实验部分（关键结果 + 消融）的数字中 ≥ 80% 带（论文 Table/Figure X）。未达标 → 在报告开头添加 ⚠️ 实验结果定位不完整，建议对照原文验证
paper_locator_map 引用一致性: 断言与证据清单中"论文位置"列引用的所有 Section/Table/Figure 编号必须存在于 paper_locator_map 中。存在不匹配 → 修正编号或标"未定位"
paper_locator_map 存在性: 最终报告必须包含"论文定位映射"section 且非空。缺失 → 从 Phase 0 输出中补入

将报告保存为文件: ./{paper_name_en}-paper-analysis-{date}.md ，保存在当前工作目录。

文件名规则: {paper_name_en} 使用论文标题的英文简写形式（小写、连字符分隔），例如：

Attention Is All You Need → attention-is-all-you-need
BERT: Pre-training of Deep Bidirectional Transformers → bert
GPT-4 Technical Report → gpt-4-technical-report

Error Handling

Agent 超时或失败: 如果某个 Agent 未返回结果，在报告中标注该维度为"数据不足，建议读者自行查阅"，其余维度照常分析
论文原文无法获取: 在报告开头标注"⚠️ 未获取到论文全文，以下分析基于摘要和外部来源，可信度较低"，并在断言清单中将所有断言的置信度上限设为 Medium
论文无法识别: 提示用户确认论文标题或提供链接，可给出模糊匹配建议
新论文信息不足: 如果搜索结果极少（如刚发布的 preprint），合并相关维度，减少重复的"信息不足"提示；社区反馈维度标注"论文较新，社区反馈尚不充分"
多版本论文: 如遇同一论文有多个版本（如 arXiv v1/v2），优先分析最新版本，并注明版本信息

Notes

每个 Agent 的输出限制 800 字，超出时优先保留有一手源支撑的内容
综合分析阶段重在交叉关联和事实校验，而非简单拼接 7 个维度的结果
核心结论应帮助读者判断"这篇论文是否值得我花时间精读"
输出语言跟随 {lang} ，默认中文
全部来源链接必须真实可访问，不得编造
"断言与证据清单"是本技能区别于普通论文总结的核心价值——它让读者知道哪些内容可信、哪些需要自行核查

paper-analysis

Safety Notice

Copy this and send it to your AI assistant to learn

paper_locator_map

Sections

Figures

Tables

Key References

硬约束（违反将导致输出被丢弃）

来源与引用规则（必须遵守）

必须的输出格式

断言-位置映射

本 Agent 专属约束

《{paper_title}》论文深度分析

核心结论

一、背景与动机

研究领域现状

核心问题与动机

二、团队与作者背景

核心作者

研究脉络

三、技术方法与创新点

核心方法

创新点

四、实验与结果评估

实验设计

关键结果

消融实验

五、优缺点与局限性

优点

局限性

改进方向

六、社区反馈与影响力

学术影响力

社区反馈

七、术语表与延伸阅读

术语索引

延伸阅读

论文定位映射（paper_locator_map）

断言与证据清单

来源登记表

Source Transparency

Related Skills

book-analysis

tech-selection-research

go-backend-requirement-analysis

send-feishu