paper-analysis

Paper Analysis — 一键深度分析一篇论文

Safety Notice

This listing is imported from skills.sh public index metadata. Review upstream SKILL.md and repository scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "paper-analysis" with this command: npx skills add jssfy/k-skills/jssfy-k-skills-paper-analysis

Paper Analysis — 一键深度分析一篇论文

输入论文 URL、PDF 路径或标题,自动并行采集七个维度的信息,交叉分析后输出结构化研究笔记。

When to Use

当用户请求以下操作时触发:

  • "分析这篇论文 https://arxiv.org/abs/..." / "分析 xxx 论文"

  • "paper analysis: Attention Is All You Need"

  • "读这篇 paper" / "帮我分析下这篇论文"

  • "这篇论文讲什么" / "论文笔记 xxx"

来源可信度规则(全局,所有 Phase/Agent 均适用)

一手源优先原则

论文原文是唯一的事实权威。所有关键数字、方法描述、实验结果必须能在论文原文中定位到具体章节/图表/公式。外部来源仅用于补充解读和社区反馈。

来源分层

层级 来源类型 用途 标注要求

L1 一手源 论文原文(arXiv HTML/PDF)、会议官方页(USENIX/ACM/IEEE/NeurIPS)、作者主页 关键事实、数字、方法描述 标注 Section/Figure/Table 编号

L2 强可信 Google Scholar、Semantic Scholar、DBLP、OpenReview 官方评审、实验室主页 引用量、h-index、评审意见 标注页面 URL + 抓取日期

L3 补充解读 知名技术博客(如作者本人博客、机构官方博客)、学术社区讨论(Reddit/Twitter 原帖) 社区反馈、通俗解读 明确标注为"外部解读",不作为事实依据

L4 低可信 新闻稿、聚合站、媒体转述、交易所/营销类网站 不得用于支撑关键事实,仅可在社区反馈维度作为"舆情信号"引用 标注"低可信来源"

段内引用与断言标注

禁止"末尾堆链接"模式。所有关键断言必须在行文中就地标注来源:

  • 论文原文事实:(论文 Section 3.2, Figure 4)

  • 外部可验证数据:(Google Scholar, 2026-03-14 抓取, 1,234 citations)

  • 外部解读:(来源名称, 外部解读)

  • 分析者推断:必须用"分析认为"/"推断"等措辞标记,不得伪装为事实

  • 时间敏感指标(引用量、star、upvote):必须标注抓取日期 + 来源 URL;无法从 L1/L2 获取则不写数字,改为"截至 {date} 未找到可靠公开数据"

Phase 0: 论文定位与输入解析

硬约束(不可跳过): 禁止检测本地是否存在已有分析文件。无论工作目录下有无同名或相似文件,都必须从头执行完整分析流程,重新生成报告。

根据用户输入,识别输入类型并执行对应流程:

输入路径

输入类型 处理流程

URL WebFetch 抓取页面,提取标题、作者、摘要、机构

PDF 路径 Read 读取 PDF 前几页,提取标题、作者、摘要

标题/关键词 WebSearch 搜索定位,再 WebFetch 获取详情

URL 输入处理

arXiv 链接

Step 1: WebFetch https://arxiv.org/abs/{id} → 提取标题、作者、摘要、提交日期 Step 2: 尝试 WebFetch https://arxiv.org/html/{id} 获取论文 HTML 全文(用于后续 Agent 引用具体章节) Step 3: WebSearch "{paper_title} conference accepted" 或 "{paper_title} published venue" → 确认发表会议/期刊

其他 URL(Semantic Scholar、ACL Anthology、OpenReview 等)

WebFetch {url} → 提取标题、作者、摘要、机构、venue

PDF 输入处理

Read {pdf_path} (前 5 页) → 提取标题、作者、摘要、机构 → 记录论文结构(章节标题列表)供后续引用 → 如信息不全,WebSearch "{提取到的标题}" 补充

标题/关键词输入处理

Step 1: WebSearch "{论文标题/关键词} arxiv OR paper OR conference" → 找到论文链接 Step 2: WebFetch {找到的链接} → 提取完整信息 Step 3: 如果找到 arXiv 链接,尝试获取 HTML 全文

如果搜索结果不明确,向用户确认后再继续。

获取论文原文(关键步骤,不可跳过)

在进入 Phase 1 之前,必须尝试获取论文原文内容作为一手事实源:

  • arXiv HTML(首选):WebFetch https://arxiv.org/html/{id} — 获取结构化全文

  • PDF:如果用户提供了 PDF 路径,Read {pdf_path} 读取全文

  • 会议官方页面:WebFetch {conference_url} — 部分会议提供 HTML 版本

将获取到的论文原文内容(或关键章节摘要)存入 {paper_content} 变量,传递给每个 Agent。如果无法获取全文,在 {paper_content} 中标注"未获取到论文全文,Agent 需通过搜索补充"。

生成论文定位映射(必须,不可跳过)

从 {paper_content} 中提取论文的结构骨架,生成 {paper_locator_map} ,后续所有 Agent 必须引用此 map 中的编号:

从论文原文中提取:

  1. Section 编号与标题(如 "Section 3.2: DualPath Architecture")
  2. 所有 Figure 编号与标题(如 "Figure 3: System overview")
  3. 所有 Table 编号与标题(如 "Table 2: Offline throughput comparison")
  4. 所有 Algorithm 编号与标题(如有)
  5. References 中被引用 ≥ 2 次的前置论文编号与标题

输出格式:

paper_locator_map

Sections

  • Section 1: Introduction
  • Section 2: Background
  • Section 3: Method
    • Section 3.1: ...
    • Section 3.2: ...
  • ...

Figures

  • Figure 1: ...
  • Figure 2: ...

Tables

  • Table 1: ...
  • Table 2: ...

Key References

  • [12] Attention Is All You Need (Vaswani et al., 2017)
  • [15] ...

如果论文 HTML 无编号(部分 arXiv 论文),用 Section 标题作为定位锚点(如 "Evaluation > Offline Throughput" )。

此步骤的输出 {paper_locator_map} 必须传给每个 Agent,作为引用时的"合法编号列表"。Agent 引用的 Section/Figure/Table 编号必须来自此 map。

确定关键变量

以下变量后续所有 Agent 都需要用到:

  • {paper_title} — 完整论文标题

  • {authors} — 作者列表

  • {institution} — 机构/团队

  • {year} — 发表年份

  • {venue} — 发表会议/期刊(未发表则标注 arXiv preprint)

  • {abstract} — 摘要

  • {paper_content} — 论文原文内容或关键章节(作为一手事实源传给每个 Agent)

  • {paper_locator_map} — 论文结构骨架(Section/Figure/Table/Algorithm 编号列表,Agent 引用必须来自此 map)

  • {paper_type} — 论文类型(学术论文 / 技术报告 / 白皮书)

  • {lang} — 输出语言(用户指定或默认中文)

  • {date} — 分析日期,格式 YYYY-MM-DD

  • {paper_name_en} — 英文文件名形式(小写、连字符分隔)

论文类型适配提示

传给每个子代理:

  • 学术论文 → "这是学术论文,侧重分析研究方法、实验设计、理论贡献"

  • 技术报告 → "这是技术报告,侧重分析系统设计、工程实践、性能指标"

  • 白皮书 → "这是白皮书,侧重分析行业洞察、方案设计、商业价值"

  • Survey/综述 → "这是综述论文,侧重分析分类框架、研究脉络、未来方向"

如果无法确定论文类型或关键信息,先用一次 WebSearch 快速查询,不要跳过这一步。

Phase 1: 并行数据采集 (7 个 Subagent)

关键要求: 以下 7 个 Agent 必须放在同一条消息中发出,确保并行执行。

每个 Agent 使用 subagent_type: "general-purpose" 。

全局 Agent 指令分为两部分,分别放在每个 Agent prompt 的开头和末尾:

{前置引用约束}(放在每个 Agent prompt 的任务描述之前,作为硬约束前置):

硬约束(违反将导致输出被丢弃)

可用的论文定位编号: {paper_locator_map} 你引用的 Section/Figure/Table 编号必须来自上述 map,不得编造不存在的编号。

  1. 每个关键数字/断言后必须就地括号标注论文位置: (论文 Section X.Y, Table/Figure Z)
    • 离线吞吐提升 1.87×(论文 Table 2, Section 5.1)
    • 离线吞吐提升 1.87×(来源: arxiv html)
    • 离线吞吐提升 1.87× (无标注)
    • ❌ 段落末尾统一放一个链接或"参见论文 Section 5" — 这是段末堆链接,不算引用
    • HTML 无编号时用 Section 标题: (论文 "Evaluation > Offline Throughput")
  2. 非数字的技术断言也需标注:具体机制(如"使用 RDMA 直接传输")、设计决策(如"采用 io_uring 旁路内核")、性能特征(如"近线性扩展")→ 必须标注论文中描述该机制的 Section/Figure
  3. L4 来源(新闻稿/聚合站/交易所)不得支撑任何事实断言
  4. 无法定位到论文具体位置的数字或技术细节 → 不写,改为定性描述或省略
  5. 分析推断必须用"分析认为/推断"标记

{输出格式要求}(放在每个 Agent prompt 的末尾):

来源与引用规则(必须遵守)

  1. 一手源优先:论文原文是唯一事实权威。关键数字和方法描述必须能定位到论文的具体 Section/Figure/Table。
  2. 段内引用:每个关键断言后必须括号标注来源,格式:
    • 论文原文:(论文 Section X.Y, Figure Z)
    • 外部验证数据:(来源名, URL, 抓取日期)
    • 外部解读:(来源名, 外部解读)
  3. 来源分层
    • L1(论文原文、会议官方页、作者主页)→ 可支撑关键事实
    • L2(Google Scholar、Semantic Scholar、OpenReview)→ 可支撑引用量等指标
    • L3(技术博客、社区讨论)→ 仅作补充解读,标注"外部解读"
    • L4(新闻稿、聚合站)→ 不得用于关键事实
  4. 不确定就不写:无法从 L1/L2 来源验证的具体数字,不写数字,改为"未找到可靠数据"。
  5. 区分事实与推断:论文原文事实直接陈述;分析者推断必须用"推断/分析认为"标记。
  6. 字数上限 800 字:超出时优先保留有一手源支撑的内容,砍掉无法验证的描述。

必须的输出格式

在你的分析文本之后,必须附加一个断言-位置映射表:

断言-位置映射

断言/数字论文位置来源层级
{每个关键数字或事实断言}Section X, Table Y / 来源URLL1/L2/L3/L4

要求: 至少覆盖你输出中的所有阿拉伯数字。无法定位的填"未定位"。

Agent 1: 背景与动机

description: "研究{paper_title}背景与动机"

prompt 模板:

{前置引用约束}

你是学术研究分析专家。请研究论文《{paper_title}》({authors}, {year})的研究背景与动机。

论文摘要:{abstract} 论文原文(如有):{paper_content} 论文定位映射:{paper_locator_map} 论文类型提示:{type_hint} 输出语言:{lang}

任务:

  1. 优先从论文原文提取:从 {paper_content} 中定位 Introduction / Related Work 部分,提取:
    • 研究领域现状和前人工作
    • 核心问题和动机
    • 标注具体 Section 编号
  2. 使用 WebSearch 搜索补充信息(至少 1 次):
    • "{paper_title} motivation background related work" → 补充论文未明确说明的领域背景
  3. 使用 WebFetch 访问至少 1 个 L1/L2 来源页面验证

整理以下信息:

研究领域现状:

  • 该领域的发展脉络和现状(标注信息来源)
  • 前人工作的主要贡献和局限(标注论文 Section)

核心问题与动机:

  • 论文要解决的核心问题(标注论文 Section)
  • 现有方法为什么不够好(标注论文中的论据)
  • 作者的切入角度和研究假设

{输出格式要求}

Agent 2: 团队与作者背景

description: "研究{paper_title}团队背景"

prompt 模板:

{前置引用约束}

本 Agent 专属约束

  • 禁止来源: 36kr、ResearchGate、新闻稿、媒体报道 — 不得作为团队背景的任何支撑
  • 入职时间、实习经历等履历细节 → 除非作者主页明确写明,否则不写(不是标"待核实",是不写)
  • 每条断言标注具体来源页面路径(如 "xinjin.github.io > Publications"),不得笼统写"来源: 作者主页"
  • 禁止定性评价: "最具影响力""核心人物""标志性学者""领军团队"等 → 除非有官方奖项/头衔页面支撑,否则不写
  • 宁缺毋滥: 若无法从作者主页/Scholar/DBLP 验证,整段缩减为"作者所属机构 + 与本文直接相关的 1-2 篇前序工作",禁止补充履历叙事。信息不足时本维度压缩为 2-4 句即可

你是学术情报分析专家。请研究论文《{paper_title}》作者团队的背景信息。

作者列表:{authors} 机构:{institution} 输出语言:{lang}

任务:

  1. 使用 WebSearch 搜索以下关键词(至少搜 2 次不同关键词):
    • "{第一作者} {institution} research site:scholar.google.com OR site:dblp.org OR site:semanticscholar.org"
    • "{通讯作者} homepage OR lab"
  2. 使用 WebFetch 访问至少 1 个作者主页、Google Scholar 或 DBLP 页面(仅 L1/L2 来源)

整理以下信息:

核心作者介绍:

  • 第一作者和通讯作者的背景(职位、研究方向、代表作)
  • 所属机构/实验室的研究特色
  • 仅列出可从官方主页或 Google Scholar 确认的荣誉/奖项
  • 无法从 L1/L2 来源验证的信息 → 不写(不是标"待核实")

研究脉络:

  • 团队在该领域的前序工作(列出具体论文名称和会议)
  • 与本论文的延续/突破关系

特别注意: 团队背景是最容易出现幻觉的维度。

  • 所有奖项、项目归属、影响力定性(如"最具影响力")必须有 L1/L2 来源支撑,否则不写
  • 入职时间、实习经历、组织归属等履历细节幻觉风险极高,除非在作者主页或论文首页明确写明,否则不写

{输出格式要求}

Agent 3: 技术方法与创新点

description: "分析{paper_title}技术方法"

prompt 模板:

{前置引用约束}

你是技术方法分析专家。请分析论文《{paper_title}》({authors}, {year})的核心技术方法和创新点。

论文摘要:{abstract} 论文原文(如有):{paper_content} 论文定位映射:{paper_locator_map} 论文类型提示:{type_hint} 输出语言:{lang}

任务:

  1. 优先从论文原文提取:从 {paper_content} 中定位 Method / Approach / System Design 部分,提取:
    • 核心方法/算法/架构
    • 关键技术组件和工作流程
    • 与前人工作的区别(论文中的 comparison)
    • 标注具体 Section/Figure/Algorithm 编号
  2. 使用 WebSearch 搜索补充解读(至少 1 次):
    • "{paper_title} method explained" 或 "{paper_title} 方法解析" → 获取通俗解读作为补充(标注为 L3 外部解读)
  3. 使用 WebFetch 访问至少 1 个技术解读页面

整理以下信息:

核心方法:

  • 论文提出的核心方法/算法/架构(标注论文 Section/Figure)
  • 关键技术组件和工作流程
  • 数学/算法层面的核心思想(用直觉解释,避免纯公式)

创新点:

  • 与前人工作的关键区别(列 2-3 点,标注论文中的论据)
  • 每个创新点为什么重要
  • 技术贡献的本质(新架构 / 新训练策略 / 新理论框架等)

{输出格式要求}

Agent 4: 实验与结果评估

description: "分析{paper_title}实验结果"

prompt 模板:

{前置引用约束}

你是实验评估专家。请分析论文《{paper_title}》({authors}, {year})的实验设计和结果。

论文摘要:{abstract} 论文原文(如有):{paper_content} 论文定位映射:{paper_locator_map} 论文类型提示:{type_hint} 输出语言:{lang}

任务:

  1. 必须从论文原文提取:从 {paper_content} 中定位 Experiments / Evaluation / Results 部分,提取:
    • 实验设置(数据集、基线、指标)
    • 关键结果数字(标注具体 Table/Figure 编号)
    • 消融实验发现
  2. 使用 WebSearch 搜索补充(至少 1 次):
    • "{paper_title} results benchmark comparison" → 了解社区对实验结果的评价
  3. 使用 WebFetch 访问至少 1 个 L1/L2 来源验证

整理以下信息:

实验设计:

  • 使用的数据集/基准(标注论文 Section)
  • 基线方法(baseline)有哪些
  • 评估指标

关键结果:

  • 主要实验结果(标注论文 Table/Figure 编号)
  • 与 baseline 的关键对比数字
  • 消融实验的主要发现(如有,标注 Table/Figure)
  • 结果是否充分验证了论文的核心 claim

特别注意: 实验数字是最需要精确的内容。所有数字必须能在论文原文的具体 Table/Figure 中找到,不得从博客或新闻稿中提取实验数据。

{输出格式要求}

Agent 5: 优缺点与局限性

description: "分析{paper_title}优缺点"

prompt 模板:

{前置引用约束}

你是学术评审专家。请分析论文《{paper_title}》({authors}, {year})的优缺点和局限性。

论文摘要:{abstract} 论文原文(如有):{paper_content} 论文定位映射:{paper_locator_map} 论文类型提示:{type_hint} 输出语言:{lang}

任务:

  1. 优先从论文原文提取:从 {paper_content} 中定位 Discussion / Limitations / Conclusion 部分,提取:
    • 作者自述的局限性(标注 Section)
    • 作者讨论的适用边界
  2. 使用 WebSearch 搜索以下关键词(至少搜 2 次不同关键词):
    • "{paper_title} limitations criticism"
    • "{paper_title} review openreview" 或 "{paper_title} 不足 局限"
  3. 使用 WebFetch 访问至少 1 个包含论文评价的页面(优先 OpenReview 官方评审)

整理以下信息:

优点:

  • 方法论层面的优点(2-3 点,标注论文中的支撑)
  • 实验层面的优点

局限性:

  • 作者自述的局限(标注论文 Section,这是最可靠的)
  • 外部评审/社区指出的不足(标注来源和层级)
  • 方法的适用边界和前置条件

改进方向:

  • 可能的改进思路(1-2 点)

{输出格式要求}

Agent 6: 社区反馈与影响力

description: "研究{paper_title}社区影响"

prompt 模板:

{前置引用约束}

你是学术影响力分析专家。请研究论文《{paper_title}》({authors}, {year})的社区反馈和学术影响力。

论文摘要:{abstract} 输出语言:{lang}

任务:

  1. 使用 WebSearch 搜索以下关键词(至少搜 2 次不同关键词):
    • "{paper_title} site:scholar.google.com OR site:semanticscholar.org"
    • "{paper_title} github implementation" 或 "{paper_title} discussion reddit twitter"
  2. 使用 WebFetch 访问:
    • 必须: 至少 1 个 L2 来源(Google Scholar 或 Semantic Scholar)获取引用数据
    • 可选: 社区讨论页面

整理以下信息:

学术影响力:

  • 引用量(标注来源 + 抓取日期,如"Google Scholar, {date}, N citations")
  • 被哪些重要后续工作引用(列出具体论文名称)
  • 是否获得最佳论文奖(仅从会议官方页面确认,无法确认则不写)

社区反馈:

  • 业界/学界的主要评价(标注来源层级)
  • 开源实现情况(GitHub URL + star 数 + 抓取日期)
  • 工业界采用情况(仅写有 L1/L2 来源支撑的)
  • 争议或批评(标注来源)

特别注意:

  • 本维度信息时效性最强,所有数字指标必须标注抓取日期和来源 URL
  • 新论文(发布 < 6 个月)社区反馈可能不充分,如实标注"论文较新,数据有限",不要编造
  • L4 来源(新闻稿/聚合站)仅可作为"舆情信号"引用,不可作为事实依据,且必须标注"L4 低可信"
  • 禁止从 L4 来源提取引用量、star 数等数字指标

{输出格式要求}

Agent 7: 术语表与延伸阅读

description: "整理{paper_title}术语与延伸阅读"

prompt 模板:

{前置引用约束}

你是学术知识整理专家。请整理论文《{paper_title}》({authors}, {year})的关键术语和推荐延伸阅读。

论文摘要:{abstract} 论文原文(如有):{paper_content} 论文定位映射:{paper_locator_map} 论文类型提示:{type_hint} 输出语言:{lang}

任务:

  1. 优先从论文原文提取:从 {paper_content} 中提取:
    • 论文定义或频繁使用的关键术语
    • References 部分引用的核心论文
  2. 使用 WebSearch 搜索补充(至少 1 次):
    • "{paper_title} related papers survey" → 了解该方向的前置和后续工作
  3. 使用 WebFetch 访问至少 1 个 L1/L2 来源验证

整理以下信息:

术语索引表:

  • 列出论文中 10-15 个关键术语/概念
  • 每个条目包含: 术语名称、简要定义(1-2 句)
  • 优先提取论文中有明确定义的术语(标注 Section)
  • 标注术语之间的关联关系

延伸阅读:

  • 前置阅读(理解本文需要先读的 2-3 篇论文,必须从论文 References 中选取,标注引用编号如 [12])
  • 后续工作(基于本文的重要后续研究 3-4 篇,必须通过 WebSearch/WebFetch 确认真实存在)
  • 每篇包含: 标题、作者、年份、与本文的关联说明、来源(论文 References [N] / Google Scholar / Semantic Scholar)
  • 不得列出无法通过搜索确认的论文——如果搜索不到,就不列

{输出格式要求}

Phase 2: 综合分析 (主线程)

等待 7 个 Agent 全部返回后,在主线程中完成以下分析。

Step 1: 信息汇总与事实校验

将 7 个 Agent 的结果整合,执行:

  • 来源层级审查:检查各 Agent 返回的断言是否有合格来源支撑,将仅有 L4 来源支撑的"事实"降级为"待验证"

  • 一致性信号:多个 Agent 从不同来源提到同一结论 = 高置信度

  • 补充关系:Agent 1 的动机与 Agent 3 的方法形成问题→方案对应

  • 矛盾信号:不同来源对某观点评价不一致 = 在报告中标注争议

  • 整理所有来源 URL,按层级分类

Step 1.5: 论文位置映射表(硬门控)

从所有 Agent 返回的"断言-位置映射表"中汇总,合并去重。然后按以下规则分类处理:

  • 合格条目(有 Section/Table/Figure 编号): 直接进入报告

  • 仅有 URL 无编号的条目: 回到 {paper_content} 全文搜索定位,补上编号

  • 搜索后仍无法定位的条目: 标注"位置待定",在报告中该数字改为定性描述(如"显著提升"替代具体倍数)

  • 来自 L4 来源的条目: 从事实段落移除,仅可在社区反馈段引用

汇总格式:

数字/断言论文位置来源 Agent状态
1.87× 离线吞吐提升Table X, Section YAgent 4合格
28.8× 算力增长Section 1, Figure ZAgent 1合格
某个数字未定位Agent 3降级为定性描述
............

门控条件: 合格条目 < 10 条时,说明论文原文提取不充分,需要重新 WebFetch 论文 HTML 并补充定位,而非直接进入 Phase 3。

Step 2: 交叉关联

在 7 个维度之间建立关联:

  • 动机 ↔ 方法映射: 将背景问题(Agent 1)与技术方案(Agent 3)一一对应

  • 方法 ↔ 实验验证: 检查创新点(Agent 3)是否在实验(Agent 4)中得到充分验证

  • 优缺点 ↔ 社区反馈: 对比作者自述局限(Agent 5)与社区评价(Agent 6)是否一致

  • 团队背景 ↔ 研究脉络: 将团队前序工作(Agent 2)与本文的延续/突破关系标注

  • 术语 ↔ 内容锚定: 验证术语(Agent 7)与各维度内容的对应关系

Step 3: 核心结论提炼

基于以上分析,撰写 3-5 句话的核心结论:

  • 这篇论文最核心的贡献是什么

  • 最值得关注的 1-2 个创新点

  • 实际影响和应用价值

  • 最适合什么样的读者

Phase 3: 输出报告

按以下 Markdown 格式输出最终报告:

《{paper_title}》论文深度分析

作者: {authors} | 机构: {institution} | 发表: {venue} {year} | 分析日期: {date}

核心结论

<!-- 硬格式:每条结论必须是独立条目,带引用槽位 -->

  • 核心贡献: {一句话}(论文 Section X, Table/Figure Y)
  • 关键创新: {一句话}(论文 Section X)
  • 关键结果: {一句话,含数字}(论文 Table X, Section Y)
  • 适合读者: {一句话}
  • 局限提示: {一句话}(论文 Section X)

一、背景与动机

研究领域现状

{该领域的发展脉络和现状,前人工作的贡献与局限} {每个关键断言后标注来源,如(论文 Section 1, [2])}

核心问题与动机

{论文要解决的核心问题、现有方法的不足、作者的切入角度} {标注论文 Section}


二、团队与作者背景

核心作者

<!-- 仅写作者主页/Google Scholar/DBLP 可直接证实的内容,无法证实的不写 --> {第一作者和通讯作者的背景、研究方向、代表作} {所有荣誉/奖项标注验证来源(具体页面路径),无法从 L1/L2 验证的不写}

研究脉络

{团队前序工作与本文的关系、实验室研究特色}


三、技术方法与创新点

核心方法

<!-- 每个技术机制(如"使用 RDMA"、"采用 io_uring")都必须标注描述该机制的论文 Section/Figure --> {论文提出的核心方法/算法/架构(标注论文 Section/Figure)} {关键技术组件和工作流程,每个组件标注论文 Section}

创新点

  1. {创新点一}: {描述及为什么重要}(论文 Section X.Y)
  2. {创新点二}: {描述及为什么重要}(论文 Section X.Y)
  3. {创新点三}: {描述及为什么重要}(论文 Section X.Y)

四、实验与结果评估

实验设计

<!-- 论文位置列不可为空,无法定位则填"未定位" -->

项目详情论文位置
数据集{使用的数据集/基准}Section X(不可为空)
基线方法{baseline 列表}Section X(不可为空)
评估指标{主要指标}Section X(不可为空)

关键结果

<!-- 硬格式:每条结果一行,数字紧跟引用,禁止段末堆链接 -->

  • {指标名}: {数字}(论文 Table X, Section Y)
  • {指标名}: {数字}(论文 Table X, Section Y)
  • {指标名}: {数字}(论文 Figure X, Section Y)
  • ...

消融实验

<!-- 硬格式:每条消融发现一行,同样逐个标注 -->

  • {消融变量}: {去掉后的数字变化}(论文 Table X)
  • {消融变量}: {去掉后的数字变化}(论文 Table X)
  • ...

五、优缺点与局限性

优点

{方法论和实验层面的优点,标注论文支撑}

局限性

{作者自述局限(标注论文 Section)、社区指出的不足(标注来源层级)、适用边界}

改进方向

{可能的改进思路}


六、社区反馈与影响力

学术影响力

{引用量(来源 + 抓取日期)、重要后续工作、获奖情况(仅官方确认的)}

社区反馈

已验证事实:

  • {可独立验证的客观信息,如平台收录、讨论帖链接、开源仓库 URL + star + 抓取日期}

外部讨论:

  • {来自社区的具体评论或观点}(来源层级, URL)

分析判断:

  • 分析认为:{基于以上事实的推理和综合判断}

七、术语表与延伸阅读

术语索引

<!-- 论文位置列不可为空,无法定位则填"未定位" -->

术语定义论文位置
{术语1}{简要定义}Section X(不可为空)
{术语2}{简要定义}Section X(不可为空)
.........

延伸阅读

前置阅读(理解本文的基础):

<!-- 前置阅读必须来自论文 References,标注引用编号 -->

论文作者年份关联说明来源
{论文1}{作者}{年份}{与本文的关联}References [N]

后续工作(已发表的相关研究):

<!-- 后续工作必须通过搜索确认真实存在,不得编造 -->

论文作者年份关联说明来源
{论文1}{作者}{年份}{与本文的关联}Google Scholar / Semantic Scholar

潜在研究方向(未发表/作者设想):

  • {方向1}:{简要描述}(来源:论文 Section X / 作者公开讨论)
  • {方向2}:{简要描述}

论文定位映射(paper_locator_map)

<!-- 必须原样输出 Phase 0 生成的 paper_locator_map,作为引用审计基准 --> <!-- 正文中所有 (论文 Section/Table/Figure X) 引用的编号必须出现在此 map 中 -->

{paper_locator_map 原文}


断言与证据清单

<!-- 必须覆盖正文中出现的所有阿拉伯数字,无遗漏 -->

#关键断言论文位置(须匹配 paper_locator_map)外部来源来源层级置信度性质
1{断言描述}Section X, Table YL1High论文原文
2{断言描述}{URL, 抓取日期}L2Medium外部验证
3{断言描述}Low分析推断
.....................

置信度说明:High = L1 来源直接支撑;Medium = L2 来源支撑或多个 L3 来源交叉验证;Low = 仅有 L3/L4 来源或为分析推断 审计方法: "论文位置"列中的每个 Section/Table/Figure 编号必须能在上方 paper_locator_map 中找到对应条目。找不到 → 该行标红待查。


来源登记表

<!-- 所有被引用的来源必须登记,便于审查"来源是否被滥用" -->

#来源层级用于支撑抓取日期
1论文原文: {paper_title}L1方法、实验、局限性
2{作者主页 URL}L1团队背景{date}
3{Google Scholar URL}L2引用量{date}
4{技术博客 URL}L3外部解读{date}
...............

L4 来源不得出现在此登记表中。 如需引用 L4 来源,仅可在正文"社区反馈 > 外部讨论"中内联标注 (L4 低可信),不登记。常见 L4 来源:bitcoinethereumnews.comaihaberleri.orgMEXC News36kr新浪科技coindesk(非技术原文时)。


本笔记由 AI 自动生成。关键数字和事实已尽量标注论文原文位置,建议结合原文验证。"断言与证据清单"可快速定位需要核查的内容。

Phase 3.5: 报告校验与修复(写入文件前必须执行,不可跳过)

Step 1: 断言引用扫描

逐行扫描报告,对每个阿拉伯数字和每个具体技术机制描述:

  • 紧跟 (论文 Section/Table/Figure X) 且编号存在于 paper_locator_map → 通过

  • 段落末尾有链接但数字/断言本身无标注 → 不合格(这是"段末堆链接"反模式)→ 把标注移到数字/断言后面

  • 有 URL 但无 Section 编号 → 回到 Step 1.5 映射表查找,补上编号或改为定性描述

  • 无任何标注 → 补上标注或删除该数字/断言

必须捕获的不合格模式(逐字符扫描以下 pattern):

  • Table 或 Figure 后无编号 → 补编号或改为 Section 引用

  • 论文 Table, Section X — Table 缺编号(逗号前应为 Table N )→ 补上 Table 编号或仅保留 Section

  • (论文 Section X) 中 X 不在 paper_locator_map → 回查论文,修正编号或标"未定位"

  • (来源: arxiv html) 或 (来源: 论文) — 这不是定位引用 → 替换为具体 Section/Table 编号

  • 引用的 Table/Figure 编号在 paper_locator_map 中不存在 → 回查论文或删除该引用

扫描范围特别关注:核心结论、关键结果、消融实验、技术方法中的具体机制名称

Step 2: 来源层级执行

逐行扫描报告全文(不仅是"来源:"行),搜索以下 L4 域名关键词:

  • 36kr / ResearchGate / MEXC / aihaberleri / bitcoinethereumnews / Eyerys / 新浪科技 / coindesk / techcrunch (非第一手技术文章时)

  • 上述域名出现在团队背景、技术方法、实验评估、优缺点段落 → 移除该来源支撑的断言,或将断言移入"社区反馈 > 外部讨论"并标 (L4 低可信)

  • 上述域名出现在参考来源区 → 移除,L4 不入参考来源区

Step 3: 结构完整性

  • 实验设计表有"论文位置"列且非空

  • 术语索引表有"论文位置"列且非空

  • 社区反馈分为: 已验证事实 / 外部讨论 / 分析判断

  • 来源登记表存在,每行有层级和"用于支撑"列,无 L4 来源

  • 断言与证据清单存在且 ≥ 10 条

Step 4: 团队背景审查

  • 无 36kr/ResearchGate/媒体稿来源

  • 无法从作者主页/Scholar 直接证实的履历细节 → 删除(不是标"待核实")

  • "据报道"/"据...报道"/"reported"/"据媒体"/"有报道称" → 如紧跟内容无 L1/L2 来源括号标注 → 删除整句("据报道"本身就是 L4 信号词)

  • 具体硬件采购数量(如"采购 N 块 GPU")→ 除非来源为公司官方公告或 SEC 文件 → 删除

Step 5: 其他校验

  • 推断有标记: 比较级/评价性表述("较快""显著""典范")标注了来源,或用"分析认为"标记

  • 延伸阅读: 前置阅读必须来自论文 References(标注 [N]);后续工作必须有来源列(Google Scholar / Semantic Scholar);无法确认存在的条目删除

  • 时间敏感指标: 引用量/star/upvote 标注抓取日期和来源 URL

  • 无占位符/编造 URL: 所有来源链接真实可访问

Step 6: 未通过项降级(不修复就降级,不降级就删除)

Step 1-5 中发现的未通过项,按以下规则强制降级:

  • 关键数字无论文位置 → 删除数字,改为定性描述(如"显著提升")

  • 技术断言无论文位置 → 删除该断言,或加"分析认为"标记降级为推断

  • 团队背景仅有 L3/L4 来源 → 删除该断言,整段压缩为"信息不足"

  • 团队背景使用定性评价("最具影响力""核心人物"等)且无官方奖项支撑 → 删除

  • 社区观点仅有 L4 来源 → 改写为"有媒体报道该工作",不得归纳行业评价

  • 延伸阅读无法确认存在 → 删除该条目

Step 7: 证据覆盖率检查(最终门控)

统计以下指标,未达标则不允许输出最终报告:

  • 阿拉伯数字覆盖率: 正文中所有阿拉伯数字必须 100% 进入"断言与证据清单"。未达标 → 补齐后再输出

  • 核心结论 L1 覆盖: 核心结论的 5 条中至少 3 条有 L1 来源支撑。未达标 → 重写核心结论,删除无 L1 支撑的条目

  • 实验数字定位率: 实验部分(关键结果 + 消融)的数字中 ≥ 80% 带 (论文 Table/Figure X) 。未达标 → 在报告开头添加 ⚠️ 实验结果定位不完整,建议对照原文验证

  • paper_locator_map 引用一致性: 断言与证据清单中"论文位置"列引用的所有 Section/Table/Figure 编号必须存在于 paper_locator_map 中。存在不匹配 → 修正编号或标"未定位"

  • paper_locator_map 存在性: 最终报告必须包含"论文定位映射"section 且非空。缺失 → 从 Phase 0 输出中补入

将报告保存为文件: ./{paper_name_en}-paper-analysis-{date}.md ,保存在当前工作目录。

文件名规则: {paper_name_en} 使用论文标题的英文简写形式(小写、连字符分隔),例如:

  • Attention Is All You Need → attention-is-all-you-need

  • BERT: Pre-training of Deep Bidirectional Transformers → bert

  • GPT-4 Technical Report → gpt-4-technical-report

Error Handling

  • Agent 超时或失败: 如果某个 Agent 未返回结果,在报告中标注该维度为"数据不足,建议读者自行查阅",其余维度照常分析

  • 论文原文无法获取: 在报告开头标注"⚠️ 未获取到论文全文,以下分析基于摘要和外部来源,可信度较低",并在断言清单中将所有断言的置信度上限设为 Medium

  • 论文无法识别: 提示用户确认论文标题或提供链接,可给出模糊匹配建议

  • 新论文信息不足: 如果搜索结果极少(如刚发布的 preprint),合并相关维度,减少重复的"信息不足"提示;社区反馈维度标注"论文较新,社区反馈尚不充分"

  • 多版本论文: 如遇同一论文有多个版本(如 arXiv v1/v2),优先分析最新版本,并注明版本信息

Notes

  • 每个 Agent 的输出限制 800 字,超出时优先保留有一手源支撑的内容

  • 综合分析阶段重在 交叉关联 和 事实校验,而非简单拼接 7 个维度的结果

  • 核心结论应帮助读者判断"这篇论文是否值得我花时间精读"

  • 输出语言跟随 {lang} ,默认中文

  • 全部来源链接必须真实可访问,不得编造

  • "断言与证据清单"是本技能区别于普通论文总结的核心价值——它让读者知道哪些内容可信、哪些需要自行核查

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Research

book-analysis

No summary provided by upstream source.

Repository SourceNeeds Review
Research

tech-selection-research

No summary provided by upstream source.

Repository SourceNeeds Review
Research

go-backend-requirement-analysis

No summary provided by upstream source.

Repository SourceNeeds Review
General

send-feishu

No summary provided by upstream source.

Repository SourceNeeds Review
219-jssfy