科技新闻聚合
从多源抓取热门科技新闻,翻译成中文并生成Markdown汇总,可选上传配图到R2。
使用场景
- 生成每日科技新闻汇总
- 需要多源聚合 + 中文摘要
- 需要带图片的Markdown报告
前置条件
- Python 3.8+ (
python3) - 翻译API:
MINIMAX_API_KEY或OPENAI_API_KEY(Minimax 默认MiniMax-M2.1-lightning) - 图片上传(可选):
~/.r2-upload.yml或R2_UPLOAD_CONFIG - 网络可访问新闻源与图片
- 可选性能参数:
FETCH_WORKERS(默认 4)、TRANSLATE_WORKERS(默认 3)
推荐流程
- 确认日期、来源、数量、是否需要图片与输出路径。
- 运行
python3 scripts/generate.py ...。 - 复查标题翻译、摘要质量、重复项与图片链接。
- 如图片失败,可用
--no-images重新生成或用scripts/process_images.py补图。
快速使用
python3 scripts/generate.py --date $(date +%F) --save ./news.md
常用参数
--sources <list>: 指定新闻源(默认:hackernews reddit-programming github-trending devto lobsters paperswithcode huggingface arxiv-ai)--count <n>: 每源抓取数量(默认:15)--limit <n>: 最终精选数量(默认:10)--max-images <n>: 处理图片上限(默认:10)--no-images: 禁用图片处理--output-only: 仅输出Markdown
分类规则
- AI与机器学习: ai, llm, gpt, claude, model
- 开发工具与开源: rust, python, github, framework
- 基础设施与云原生: cloud, aws, kubernetes, docker
- 产品与设计: product, design, ui, startup
- 趣闻与观点: 其他
输出格式
采用固定结构,确保一致性:
# 📰 YYYY-MM-DD 科技早报
> 📊 **今日导读**
> 精选 10 条科技新闻
> 来源:Hacker News(4) | GitHub Trending(3) | Lobsters(3)
---
## 📋 文章速览
**AI与机器学习**:3 篇
1. 文章标题一
2. 文章标题二
...
---
## AI 与机器学习
### 1. 文章中文标题
📰 **Hacker News**
<img src="https://r2.example.com/image.jpg" width="100%">
**摘要**:中文摘要内容...
**核心要点**:
• 要点一
• 要点二
• 要点三
🔗 [阅读原文](https://example.com)
---
完整模板与示例见 references/EXAMPLES.md。
参考
references/WORKFLOW.mdreferences/SOURCES.mdreferences/EXAMPLES.md