招投标信息采集技能
概述
自动化采集盐南高新区、经开区相关招投标信息,支持:多网站并行采集、智能区域筛选、数据去重存储、PDF日报/月报生成、飞书推送。
触发场景:用户需要监控招标信息、采集特定区域项目、生成招投标日报/推送飞书
核心工作流程
1. 执行采集
cd "C:\Users\YC\.openclaw\workspace\skills\bidding-assistant"
python scripts/run_daily_collection.py --force
2. 生成PDF报告
# 生成月报
python scripts/generate_monthly_pdfs.py
# 生成日报
python scripts/pdf_generator.py --type daily --date 2026-05-04
3. 发送飞书通知
# 发送月报到飞书用户/群聊
python scripts/generate_and_send_monthly_report.py
数据库路径(重要!)
数据库:C:\Users\YC\.openclaw\workspace\skills\bidding-assistant\招投标数据\history.db
采集和PDF生成必须使用同一个数据库!
区域筛选规则
- 目标区域:盐南高新区、经开区
- 排除区域:亭湖、盐都、响水、滨海、建湖、大丰、射阳、阜宁、东台
- 筛选基于项目标题关键词匹配
支持的网站
- 盐城市政府采购网
- 开发区公共资源交易网
- 城南新区公共资源交易网
- 江苏世纪新城
- 盐城市大数据集团
- 盐城市东方集团
- 盐城市都市建设投资集团
- 经开城发集团
- 悦达集团
- 苏服采(API直连)
苏服采采集(API直连)
苏服采 https://js.fwgov.cn 通过直接调用后端API采集数据:
API: POST https://js.fwgov.cn:868/purchases/tenders/notice/page
地区代码: 盐南高新区=320992, 经开区=320991
飞书文件发送
使用IM API上传文件(不是Drive API):
- 上传:
POST /im/v1/files→ 返回file_key - 发送:
POST /im/v1/messages→content: {"file_key": xxx}
详细配置见 references/飞书企业自建应用配置指南.md
项目结构
bidding-assistant/
├── SKILL.md
├── assets/
│ └── image.png
├── references/
│ ├── 飞书企业自建应用配置指南.md
│ ├── 飞书推送配置说明.md
│ ├── PDF报告排版说明.md
│ ├── PDF报告生成与飞书推送使用指南.md
│ ├── PDF显示优化说明.md
│ ├── openclaw-browser-relay-guide.md
│ ├── sufu-workflow.md
│ └── website-config.md
└── scripts/
├── crawler.py # 采集器基类和所有网站采集器
├── sufu_crawler_final.py # 苏服采采集器(API直连版)
├── pdf_generator.py # PDF日报/月报生成器
├── feishu_enterprise_app.py # 飞书开放平台API客户端
├── feishu_notifier.py # 飞书Webhook通知器
├── generate_and_send_monthly_report.py # 生成并发送月报
├── generate_monthly_pdfs.py # 生成月报PDF
├── pdf_generator.py # PDF生成器
├── run_daily_collection.py # 每日采集任务入口
└── scheduler.py # 定时任务调度器
依赖
requests>=2.28.0
beautifulsoup4>=4.11.0
lxml>=4.9.0
reportlab>=3.6.0
openpyxl>=3.1.0
apscheduler>=3.10.0
如使用浏览器自动化方式(苏服采旧版),还需:playwright>=1.35.0 和 playwright install chromium