arXiv 论文周报技能

当用户提出以下类型的需求时，使用本技能：

按学科领域和关键词搜索 arXiv 论文
查看最近一周某个方向的新论文
生成 arXiv 论文周报
总结最近论文的主要创新点
做文献追踪、论文速览、研究趋势观察

本技能的目标是：

根据用户给出的学科领域和关键词，在 arXiv 中检索最近一周上传或更新的相关论文；
挑选最相关的一批论文；
分析每篇论文的研究问题、方法思路、主要创新点、意义与可能局限；
生成一份结构化中文周报；
将最终周报保存到指定目录，便于后续归档和复用。

一、输入理解规则

从用户请求中尽量提取以下信息：

学科领域 / arXiv 分类代码
关键词
时间范围（默认最近 7 天）
论文数量上限（默认 10 篇，最多建议 20 篇）
输出语言（默认中文）
是否需要“重点推荐论文”
是否需要“趋势总结”

如果用户给的是自然语言领域名称，请映射为常见 arXiv 分类代码：

自然语言处理 / NLP -> cs.CL
计算机视觉 / CV -> cs.CV
机器学习 / Machine Learning -> cs.LG
人工智能 / AI -> cs.AI
机器人 / Robotics -> cs.RO
语音 / Audio / Speech -> eess.AS
强化学习 -> 常优先考虑 cs.LG，必要时兼顾 cs.AI
多模态 -> 常优先考虑 cs.CV、cs.CL、cs.LG，根据用户表达选择最贴近的一类

如果用户没有明确提供分类代码，但领域名称足够清晰，则直接做合理映射，不必反复追问。

如果用户未明确说明时间范围，则默认检索最近 7 天。

如果用户未明确说明论文数量，则默认纳入分析 5 到 10 篇最相关论文。

二、执行方式

优先使用 Python 脚本：

~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_weekly.py

该脚本负责：

按分类与关键词检索 arXiv
拉取最近一周论文
返回结构化 JSON

调用时使用如下形式：

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_weekly.py --category <分类代码> --keywords "<关键词1>,<关键词2>,..." --days 7 --max-results 20

说明：

--category 为 arXiv 分类代码，例如 cs.LG
--keywords 为逗号分隔的关键词列表
--days 默认为 7
--max-results 是从 arXiv 拉取的候选论文上限，建议 10~30

如果用户给出多个关键词，应尽量全部传入脚本。

如果脚本返回候选论文较多，应优先挑选最相关的前 5~10 篇用于周报分析。

如果有能力执行文件写入操作，则在生成最终周报后必须写入指定目录中的 Markdown 文件。

三、论文筛选规则

脚本返回结果后，按以下原则筛选用于周报的论文：

必须在给定时间窗口内（默认最近 7 天）
优先保留与关键词高度相关的论文
优先保留标题与摘要都明显相关的论文
避免重复主题占比过高，尽量保留主题多样性
如果结果很多，优先选最值得阅读的 5~10 篇

如果相关论文数量很少，可以如实说明“本周匹配论文较少”。

如果没有找到合适论文，应明确告诉用户没有检索到足够相关的论文，不要编造结果。

四、每篇论文的分析要求

对每篇选中的论文，基于标题、摘要、分类和链接，提炼以下内容：

论文标题
作者
提交/更新时间
arXiv 链接
研究问题：论文要解决什么问题
方法思路：核心方法是什么
主要创新点：相对已有工作新在哪里
价值与意义：为什么值得关注
可能局限：基于摘要能看出的适用边界或潜在不足
论文评分：5分制，从以下几个维度考虑

评价指标分值
创新性 1
方法有效性 1
实验完整性 1
实用价值 1
行文逻辑 1

评价指标	分值
创新性	1
方法有效性	1
实验完整性	1
实用价值	1
行文逻辑	1

要求：

保持谨慎，不要虚构论文中未出现的实验细节
如果只是从摘要推断出的内容，要避免说得过于绝对
尽量用简洁、专业、适合科研汇报的语言
如果信息不足，要明确写出“仅基于摘要判断”

五、全文获取规则

当出现以下情况时，必须考虑调用本技能目录下的全文提取脚本：

~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py

适用场景：

仅凭摘要无法准确判断论文的主要创新点；
摘要对方法细节描述过少，无法完成高质量分析；
论文明显很有价值，值得进一步阅读全文；
需要确认实验设置、方法结构、贡献点表述或局限分析时；
需要对重点推荐论文做更深入解读时。

调用方式示例：

注意：

需要在workspace创建虚拟环境并激活，并执行pip install pypdf

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py --id <arxiv_id> --max-pages 12 --save-text

或：

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py --pdf-url <pdf链接> --max-pages 12 --save-text

执行要求：

默认先提取前 8 到 12 页；
如果前几页仍不足以支持分析，可适当增加页数；
不要默认对所有论文都抓取全文，避免不必要的开销；
优先对重点论文或摘要不充分的论文使用全文提取；
使用全文后，应基于全文内容补充或修正对创新点、方法思路和局限性的判断；
如果全文提取失败，应明确说明失败原因，并退回基于摘要进行谨慎总结。

如果脚本成功提取全文，可优先使用以下信息进行深度分析：

摘要
引言
方法部分
实验部分
结论部分

六、周报输出格式

默认输出为中文 Markdown 周报，并且除了在对话中给出摘要外，还必须将完整周报保存为 .md 文件到以下目录：

~/.openclaw/skills/arxiv-weekly-report/report

周报结构如下：

<主题> arXiv 最近一周论文周报

1. 本周概览

检索领域：
检索关键词：
时间范围：
命中论文数：
最终纳入分析数：

2. 本周重点结论

用 3~6 条总结本周最值得关注的趋势、方法变化或新动向。

3. 重点论文解读

对每篇论文按如下格式输出：

论文 1：<标题>

作者：
时间：
分类：
链接：
研究问题：
方法思路：
主要创新点：
价值与意义：
可能局限：

论文 2：<标题>

作者：
时间：
分类：
链接：
研究问题：
方法思路：
主要创新点：
价值与意义：
可能局限：

依此类推。

4. 本周趋势观察

从所有入选论文中提炼：

高频主题
常见方法路线
新出现的研究方向
值得持续跟踪的问题

5. 建议重点跟踪论文

给出 3~5 篇最值得继续阅读的论文，并说明推荐原因。

6. 附录（可选）

如果需要，可附上未纳入重点解读但值得关注的论文列表。

七、输出风格要求

默认使用中文
语言简洁、准确、偏学术报告风格
不要使用夸张宣传语
不要把摘要原文大段照搬
重点突出“创新点”和“为什么值得关注”
如果信息不足，要明确说明“仅基于摘要判断”
如果论文很多，优先总结共性趋势，再展开重点论文

八、结果落盘要求

生成周报后，必须将最终周报保存到以下目录：

~/.openclaw/skills/arxiv-weekly-report/report

保存格式要求：

文件格式必须为 Markdown
文件后缀必须为 .md
如果目录不存在，应先创建目录再写入文件
文件名应包含主题和日期，便于后续归档和检索

推荐文件名格式：

arxiv_weekly_report_<category>_<YYYY-MM-DD>.md

例如：

arxiv_weekly_report_cs.LG_2026-03-18.md
arxiv_weekly_report_cs.CL_2026-03-18.md

在完成周报内容生成后，必须：

确保目录 ~/.openclaw/skills/arxiv-weekly-report/report 存在；
将最终周报写入该目录下的 .md 文件；
在回复用户时，说明周报已保存，并给出保存路径；
如写入失败，应明确说明失败原因，不要假装已经成功保存。

如果同时需要在对话中展示内容，则可以先给出摘要版，再说明完整版本已保存到指定路径。

九、异常处理

如果脚本执行失败、无网络、arXiv 无结果、分类不合法、返回数据为空或文件写入失败，应：

直接说明问题；
尝试给出可能原因；
如有必要，建议用户修改分类代码或关键词；
不要编造论文结果；
不要假装周报已经保存成功。

如果脚本返回空结果，但用户需求合理，可以建议：

放宽关键词
改为相邻领域分类
延长时间窗口，例如最近 14 天

十、额外说明

如果用户明确要求：

“只看最近 3 天”，则修改 days
“多给一点论文”，可适当提高纳入分析数量
“英文输出”，则将周报改为英文
“只给简版”，则保留概览 + 重点结论 + 推荐论文即可
“给出完整周报文件”，则优先确保 Markdown 文件写入成功并返回保存路径

如果用户未特别说明，默认：

中文输出
最近 7 天
8 到 12 篇重点论文
输出完整周报并保存到 report 目录

十一、最终行为要求

完成任务时，必须尽量遵循以下顺序：

理解用户输入中的领域、关键词、时间范围与输出要求；
调用 fetch_arxiv_weekly.py 获取候选论文；
进行相关性筛选与内容分析，对于重点推荐论文需要做更深入解读，调用fetch_arxiv_pdf_text.py获取全文；
生成结构化中文周报；
将完整周报写入 ~/.openclaw/skills/arxiv-weekly-report/report 目录下的 .md 文件；
在回复中告知用户周报已生成，并给出保存路径；
如果任一步骤失败，应明确说明失败位置和原因。

arxiv-weekly-report

Safety Notice

Copy this and send it to your AI assistant to learn