🎓 Journal Deep Intel Intelligence Station
这是一个为医学与生命科学科研人员定制的自动化情报工具。它解决了“只看标题不了解实质内容”的痛点,通过模拟深度访问,为每一篇新文献建立完整的摘要档案。
🌟 核心功能
- 深度抓取:不同于常规爬虫,本工具会逐一进入 PubMed 详情页提取 Abstract (摘要)。
- 精准过滤:利用 PubMed 官方 Publication Type 标签,自动剔除新闻、社论和简报,只留硬核干货。
- 时间窗口监控:基于
[pdat]逻辑,支持按周或按月生成定制化文献简报。 - AI 友好型输出:生成结构化的 JSON 数据,完美适配 OpenClaw 内部的 LLM 总结流程。
🛠️ 技术实现
- 引擎:基于 Python 3.x 配合 BeautifulSoup4 处理 HTML 解析。
- 频率控制:内置 0.5s 的抓取延迟(Rate Limiting),保护您的 IP 不被 PubMed 临时封禁。
- 本地归档:数据自动保存至
~/Documents/Journal_Intel/目录下,按日期和期刊名分类存储。
📖 使用场景示例
- 场景一:Nature 周报
参数:
journal="Nature", type="Article", days=7 - 场景二:顶级综述追踪
参数:
journal="Science", type="Review", days=30
⚠️ 运行提示
由于需要进行深度详情页抓取,运行速度约为 1秒/篇。若当周更新较多(如超过 50 篇),请耐心等待脚本运行结束。