arxiv-weekly-report

根据 arXiv 学科分类和关键词检索最近一周论文,提炼主要创新点,并生成周报。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "arxiv-weekly-report" with this command: npx skills add shu-ang/arxiv-weekly-report

arXiv 论文周报技能

当用户提出以下类型的需求时,使用本技能:

  • 按学科领域和关键词搜索 arXiv 论文
  • 查看最近一周某个方向的新论文
  • 生成 arXiv 论文周报
  • 总结最近论文的主要创新点
  • 做文献追踪、论文速览、研究趋势观察

本技能的目标是:

  1. 根据用户给出的学科领域和关键词,在 arXiv 中检索最近一周上传或更新的相关论文;
  2. 挑选最相关的一批论文;
  3. 分析每篇论文的研究问题、方法思路、主要创新点、意义与可能局限;
  4. 生成一份结构化中文周报;
  5. 将最终周报保存到指定目录,便于后续归档和复用。

一、输入理解规则

从用户请求中尽量提取以下信息:

  • 学科领域 / arXiv 分类代码
  • 关键词
  • 时间范围(默认最近 7 天)
  • 论文数量上限(默认 10 篇,最多建议 20 篇)
  • 输出语言(默认中文)
  • 是否需要“重点推荐论文”
  • 是否需要“趋势总结”

如果用户给的是自然语言领域名称,请映射为常见 arXiv 分类代码:

  • 自然语言处理 / NLP -> cs.CL
  • 计算机视觉 / CV -> cs.CV
  • 机器学习 / Machine Learning -> cs.LG
  • 人工智能 / AI -> cs.AI
  • 机器人 / Robotics -> cs.RO
  • 语音 / Audio / Speech -> eess.AS
  • 强化学习 -> 常优先考虑 cs.LG,必要时兼顾 cs.AI
  • 多模态 -> 常优先考虑 cs.CVcs.CLcs.LG,根据用户表达选择最贴近的一类

如果用户没有明确提供分类代码,但领域名称足够清晰,则直接做合理映射,不必反复追问。

如果用户未明确说明时间范围,则默认检索最近 7 天。

如果用户未明确说明论文数量,则默认纳入分析 5 到 10 篇最相关论文。

二、执行方式

优先使用 Python 脚本:

~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_weekly.py

该脚本负责:

  • 按分类与关键词检索 arXiv
  • 拉取最近一周论文
  • 返回结构化 JSON

调用时使用如下形式:

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_weekly.py --category <分类代码> --keywords "<关键词1>,<关键词2>,..." --days 7 --max-results 20

说明:

  • --category 为 arXiv 分类代码,例如 cs.LG
  • --keywords 为逗号分隔的关键词列表
  • --days 默认为 7
  • --max-results 是从 arXiv 拉取的候选论文上限,建议 10~30

如果用户给出多个关键词,应尽量全部传入脚本。

如果脚本返回候选论文较多,应优先挑选最相关的前 5~10 篇用于周报分析。

如果有能力执行文件写入操作,则在生成最终周报后必须写入指定目录中的 Markdown 文件。

三、论文筛选规则

脚本返回结果后,按以下原则筛选用于周报的论文:

  1. 必须在给定时间窗口内(默认最近 7 天)
  2. 优先保留与关键词高度相关的论文
  3. 优先保留标题与摘要都明显相关的论文
  4. 避免重复主题占比过高,尽量保留主题多样性
  5. 如果结果很多,优先选最值得阅读的 5~10 篇

如果相关论文数量很少,可以如实说明“本周匹配论文较少”。

如果没有找到合适论文,应明确告诉用户没有检索到足够相关的论文,不要编造结果。

四、每篇论文的分析要求

对每篇选中的论文,基于标题、摘要、分类和链接,提炼以下内容:

  • 论文标题

  • 作者

  • 提交/更新时间

  • arXiv 链接

  • 研究问题:论文要解决什么问题

  • 方法思路:核心方法是什么

  • 主要创新点:相对已有工作新在哪里

  • 价值与意义:为什么值得关注

  • 可能局限:基于摘要能看出的适用边界或潜在不足

  • 论文评分:5分制,从以下几个维度考虑

    评价指标分值
    创新性1
    方法有效性1
    实验完整性1
    实用价值1
    行文逻辑1

要求:

  • 保持谨慎,不要虚构论文中未出现的实验细节
  • 如果只是从摘要推断出的内容,要避免说得过于绝对
  • 尽量用简洁、专业、适合科研汇报的语言
  • 如果信息不足,要明确写出“仅基于摘要判断”

五、全文获取规则

当出现以下情况时,必须考虑调用本技能目录下的全文提取脚本:

~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py

适用场景:

  1. 仅凭摘要无法准确判断论文的主要创新点;
  2. 摘要对方法细节描述过少,无法完成高质量分析;
  3. 论文明显很有价值,值得进一步阅读全文;
  4. 需要确认实验设置、方法结构、贡献点表述或局限分析时;
  5. 需要对重点推荐论文做更深入解读时。

调用方式示例:

注意:

需要在workspace创建虚拟环境并激活,并执行pip install pypdf

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py --id <arxiv_id> --max-pages 12 --save-text

或:

python3 ~/.openclaw/skills/arxiv-weekly-report/scripts/fetch_arxiv_pdf_text.py --pdf-url <pdf链接> --max-pages 12 --save-text

执行要求:

  • 默认先提取前 8 到 12 页;
  • 如果前几页仍不足以支持分析,可适当增加页数;
  • 不要默认对所有论文都抓取全文,避免不必要的开销;
  • 优先对重点论文或摘要不充分的论文使用全文提取;
  • 使用全文后,应基于全文内容补充或修正对创新点、方法思路和局限性的判断;
  • 如果全文提取失败,应明确说明失败原因,并退回基于摘要进行谨慎总结。

如果脚本成功提取全文,可优先使用以下信息进行深度分析:

  • 摘要
  • 引言
  • 方法部分
  • 实验部分
  • 结论部分

六、周报输出格式

默认输出为中文 Markdown 周报,并且除了在对话中给出摘要外,还必须将完整周报保存为 .md 文件到以下目录:

~/.openclaw/skills/arxiv-weekly-report/report

周报结构如下:

<主题> arXiv 最近一周论文周报

1. 本周概览

  • 检索领域:
  • 检索关键词:
  • 时间范围:
  • 命中论文数:
  • 最终纳入分析数:

2. 本周重点结论

用 3~6 条总结本周最值得关注的趋势、方法变化或新动向。

3. 重点论文解读

对每篇论文按如下格式输出:

论文 1:<标题>

  • 作者:
  • 时间:
  • 分类:
  • 链接:
  • 研究问题:
  • 方法思路:
  • 主要创新点:
  • 价值与意义:
  • 可能局限:

论文 2:<标题>

  • 作者:
  • 时间:
  • 分类:
  • 链接:
  • 研究问题:
  • 方法思路:
  • 主要创新点:
  • 价值与意义:
  • 可能局限:

依此类推。

4. 本周趋势观察

从所有入选论文中提炼:

  • 高频主题
  • 常见方法路线
  • 新出现的研究方向
  • 值得持续跟踪的问题

5. 建议重点跟踪论文

给出 3~5 篇最值得继续阅读的论文,并说明推荐原因。

6. 附录(可选)

如果需要,可附上未纳入重点解读但值得关注的论文列表。

七、输出风格要求

  • 默认使用中文
  • 语言简洁、准确、偏学术报告风格
  • 不要使用夸张宣传语
  • 不要把摘要原文大段照搬
  • 重点突出“创新点”和“为什么值得关注”
  • 如果信息不足,要明确说明“仅基于摘要判断”
  • 如果论文很多,优先总结共性趋势,再展开重点论文

八、结果落盘要求

生成周报后,必须将最终周报保存到以下目录:

~/.openclaw/skills/arxiv-weekly-report/report

保存格式要求:

  • 文件格式必须为 Markdown
  • 文件后缀必须为 .md
  • 如果目录不存在,应先创建目录再写入文件
  • 文件名应包含主题和日期,便于后续归档和检索

推荐文件名格式:

arxiv_weekly_report_<category>_<YYYY-MM-DD>.md

例如:

  • arxiv_weekly_report_cs.LG_2026-03-18.md
  • arxiv_weekly_report_cs.CL_2026-03-18.md

在完成周报内容生成后,必须:

  1. 确保目录 ~/.openclaw/skills/arxiv-weekly-report/report 存在;
  2. 将最终周报写入该目录下的 .md 文件;
  3. 在回复用户时,说明周报已保存,并给出保存路径;
  4. 如写入失败,应明确说明失败原因,不要假装已经成功保存。

如果同时需要在对话中展示内容,则可以先给出摘要版,再说明完整版本已保存到指定路径。

九、异常处理

如果脚本执行失败、无网络、arXiv 无结果、分类不合法、返回数据为空或文件写入失败,应:

  1. 直接说明问题;
  2. 尝试给出可能原因;
  3. 如有必要,建议用户修改分类代码或关键词;
  4. 不要编造论文结果;
  5. 不要假装周报已经保存成功。

如果脚本返回空结果,但用户需求合理,可以建议:

  • 放宽关键词
  • 改为相邻领域分类
  • 延长时间窗口,例如最近 14 天

十、额外说明

如果用户明确要求:

  • “只看最近 3 天”,则修改 days
  • “多给一点论文”,可适当提高纳入分析数量
  • “英文输出”,则将周报改为英文
  • “只给简版”,则保留概览 + 重点结论 + 推荐论文即可
  • “给出完整周报文件”,则优先确保 Markdown 文件写入成功并返回保存路径

如果用户未特别说明,默认:

  • 中文输出
  • 最近 7 天
  • 8 到 12 篇重点论文
  • 输出完整周报并保存到 report 目录

十一、最终行为要求

完成任务时,必须尽量遵循以下顺序:

  1. 理解用户输入中的领域、关键词、时间范围与输出要求;
  2. 调用 fetch_arxiv_weekly.py 获取候选论文;
  3. 进行相关性筛选与内容分析,对于重点推荐论文需要做更深入解读,调用fetch_arxiv_pdf_text.py获取全文;
  4. 生成结构化中文周报;
  5. 将完整周报写入 ~/.openclaw/skills/arxiv-weekly-report/report 目录下的 .md 文件;
  6. 在回复中告知用户周报已生成,并给出保存路径;
  7. 如果任一步骤失败,应明确说明失败位置和原因。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

通义晓蜜 - 智能外呼

触发阿里云晓蜜外呼机器人任务,自动批量拨打电话。适用于批量外呼、客户回访、满意度调查、简历筛查约面试等场景。可从前置工具或节点获取外呼名单。

Registry SourceRecently Updated
General

Letterboxd Watchlist

Scrape a public Letterboxd user's watchlist into a CSV/JSONL list of titles and film URLs without logging in. Use when a user asks to export, scrape, or mirror a Letterboxd watchlist, or to build watch-next queues.

Registry SourceRecently Updated
General

Seedance Video Generation

Generate AI videos using ByteDance Seedance. Use when the user wants to: (1) generate videos from text prompts, (2) generate videos from images (first frame, first+last frame, reference images), or (3) query/manage video generation tasks. Supports Seedance 1.5 Pro (with audio), 1.0 Pro, 1.0 Pro Fast, and 1.0 Lite models.

Registry SourceRecently Updated
4.2K17jackycser
General

Universal Skills Manager

The master coordinator for AI skills. Discovers skills from multiple sources (SkillsMP.com, SkillHub, and ClawHub), manages installation, and synchronization...

Registry SourceRecently Updated