yindeng_ analyse

# CoPAW 银登公告与结果爬取 Skill

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "yindeng_ analyse" with this command: npx skills add aiyouBug/yindenganalyse

CoPAW 银登公告与结果爬取 Skill

这是一个用于 CoPAW (Copilot Automation Workflow) 的标准 Skill,支持自动爬取银登网不良贷款转让公告及转让结果,并利用大模型(LLM)提取关键数据。

目录结构

yindeng_skill/
├── skill.py             # 标准 Skill 接口 (Agent/Tool Use)
├── skill.json           # Skill 元数据定义
├── main.py              # CLI 入口脚本
├── crawler.py           # 核心爬虫逻辑
├── ocr_utils.py         # OCR 与数据汇总工具
├── requirements.txt     # 依赖清单
└── SKILL.md             # 说明文档

Agent 集成 (CoPaw / Tool Use)

本 Skill 提供了标准的 Python 函数接口和 JSON Schema 定义,可供 AI Agent 直接调用。

Python 接口

from skill import run_yindeng_crawler

# 爬取并分析
result = run_yindeng_crawler(source="result", analyze=True)
print(result)

Skill 定义 (skill.json)

包含完整的工具描述和参数定义,符合 OpenAI/Anthropics Tool Schema 标准。

功能特性

  1. 多任务支持:可同时爬取“转让公告”和“转让结果公告”。
  2. 自动爬取:根据日期(自动计算或指定)爬取银登网公告并下载 PDF。
  3. 智能分析:支持多模型(DeepSeek、千问、硅基流动等)提取 PDF 中的关键金融数据。
  4. 数据导出
    • 爬取记录 Excel
    • 债权转让证明信息汇总(仅结果公告,含 OCR 数据)
    • LLM 分析结果报表 (analysis_result.xlsx)

部署与使用

1. 安装依赖

在运行环境或 Docker 容器中安装 Python 依赖(需提前安装 Tesseract-OCR 和 Poppler):

pip install -r requirements.txt

2. 环境变量配置 (LLM)

设置以下环境变量以启用 LLM 分析功能。本 Skill 支持多种 LLM 提供商。

通用配置

  • LLM_API_KEY: (必须) 您的 API Key。
  • LLM_PROVIDER: (可选) 指定服务商,如 deepseek, siliconflow, qwen。默认为 deepseek
  • LLM_API_BASE: (可选) API 基础地址。
  • LLM_MODEL: (可选) 模型名称。

常用服务商配置示例

DeepSeek (默认)

export LLM_API_KEY="sk-..."
export LLM_PROVIDER="deepseek"
# 默认 BASE: https://api.deepseek.com/v1
# 默认 MODEL: deepseek-chat

硅基流动 (SiliconFlow)

export LLM_API_KEY="sk-..."
export LLM_PROVIDER="siliconflow"
# 默认 BASE: https://api.siliconflow.cn/v1
# 默认 MODEL: deepseek-ai/DeepSeek-V3

通义千问 (DashScope/Aliyun)

export LLM_API_KEY="sk-..."
export LLM_PROVIDER="qwen"
# 默认 BASE: https://dashscope.aliyuncs.com/compatible-mode/v1
# 默认 MODEL: qwen-plus

3. 调用方式

默认运行(爬取公告 + 结果):

python main.py

仅爬取转让结果:

python main.py --source result

爬取并启用 LLM 分析:

python main.py --analyze

指定日期运行:

python main.py 2026-03-03

输出结果

  • 转让公告: YYYY-MM-DD银登公告/
  • 转让结果: YYYY-MM-DD银登公告结果/
    • *债权转让证明信息汇总.xlsx: 包含 OCR 识别后的结构化数据。
    • analysis_result.xlsx: 包含 LLM 提取的深度分析数据。

退出码说明

  • 0: 成功且有新数据。
  • 2: 成功但暂无更新(所有任务均无新增数据)。
  • 1: 运行出错。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Digital Ocean

Digital Ocean integration. Manage Accounts. Use when the user wants to interact with Digital Ocean data.

Registry SourceRecently Updated
General

旅游攻略规划技能

飞猪旅游攻略规划技能。使用场景:(1) 从小红书搜索目的地旅游攻略,(2) 自动提取攻略中的目的地、日期、行程信息,(3) 查询飞猪机票价格并插入攻略中,(4) 生成完整的行程规划报告(含攻略 + 最低价机票链接 + 天气预报 + 详细预算)。

Registry SourceRecently Updated
General

Webflow SEO/GEO + API

Manage SEO and GEO content updates in Webflow by prioritizing with GSC, drafting content, creating patch JSONs, updating CMS via API, optimizing images and S...

Registry SourceRecently Updated