scnet-ocr

将图片中的文字、通用文字识别, 居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证, 营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书, 增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票等信息识别并提取出来。本技能应在用户需要 OCR 识别图片中的文字,或识别通用文字识别, 居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证, 营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书, 增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票时使用。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "scnet-ocr" with this command: npx skills add scnet-ocr

Sugon-Scnet 通用 OCR 技能

本技能封装了 Sugon-Scnet 通用 OCR 服务,通过单一接口即可调用 31 种识别能力,高效提取文字及票据信息。

功能特性

  • 通用文字识别:提取图片中的全部文字,支持横竖版及坐标定位。
  • 个人证照:识别居民身份证, 银行卡, 社保卡, 户口本, 出生医学证明, 往来港澳通行证, 往来台湾通行证, 台湾居民来往大陆通行证, 港澳居民来往内地通行证。
  • 行业资质:识别营业执照, 社会团体法人登记证书, 工会法人资格证书, 宗教活动场所登记证, 民办非企业单位登记证书, 事业单位法人证书, 统一社会信用代码证书。
  • 财务票据:覆盖增值税发票, 增值税卷票, 出租车发票, 火车票, 航空运输电子客票行程单, 机动车销售统一发票, 定额发票, 过路过桥费发票, 医疗门诊发票, 税收完税证明, 船票, 非税票据, 通用机打发票, 汽车票,自动提取关键字段。

前置配置

⚠️ 重要:使用前需要申请 Scnet API Token

申请 API Token

  1. 访问 Scnet 官网 注册/登录
  2. 在控制台申请 API 密钥(格式:sc-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
  3. 复制密钥备用

配置 Token

手动配置(推荐)

  1. 在技能目录下创建 config/.env 文件,内容如下:
# =====  Sugon-Scnet OCR API 配置 =====
# 申请地址:https://www.scnet.cn
SCNET_API_KEY=your_scnet_api_key_here

# API 基础地址(一般无需修改)
SCNET_API_BASE=https://api.scnet.cn/api/llm/v1
  1. 添加:SCNET_API_KEY=你的密钥
  2. 设置文件权限为 600(仅所有者可读写) ⚠️ 安全警告:切勿将 API Key 直接粘贴到聊天对话中,否则可能被记录或泄露。

Token 更新

Token 过期后调用会返回 401 或 403 错误。更新方法:重新申请 Token 并替换 config/.env 中的 SCNET_API_KEY。

依赖安装

本技能需要 Python 3.6+ 和 requests 库。请运行以下命令:

   pip install requests

使用方法

参数说明

参数名类型必填描述
ocrTypestring识别类型枚举。必须为以下之一:<br>• GENERAL(通用文字)<br>• ID_CARD(身份证)<br>• BANK_CARD(银行卡)<br>• SOCIAL_SECURITY_CARD(社保卡)<br>• HOUSEHOLD_REGISTER(户口本)<br>• BIRTH_CERTIFICATE(出生医学证明)<br>• HK_MACAU_PASS(往来港澳通行证)<br>• TAIWAN_PASS(往来台湾通行证)<br>• TAIWAN_MAINLAND_PASS(台湾居民来往大陆通行证)<br>• HK_MAINLAND_PASS(港澳居民来往内地通行证)<br>• BUSINESS_LICENSE(营业执照)<br>• SOCIAL_ORG_REG(社会团体法人登记证书)<br>• TRADE_UNION_REG(工会法人资格证书)<br>• RELIGIOUS_ACTIVITY_REG(宗教活动场所登记证)<br>• PRIVATE_NON_ENTERPRISE_REG(民办非企业单位登记证书)<br>• INSTITUTION_LEGAL_REG(事业单位法人证书)<br>• UNIFIED_SOCIAL_CREDIT_REG(统一社会信用代码证书)<br>• VAT_INVOICE(增值税发票)<br>• VAT_ROLL_INVOICE(增值税卷票)<br>• TAXI_INVOICE(出租车发票)<br>• TRAIN_TICKET(火车票)<br>• AIRPORT_TICKET(航空运输电子客票行程单)<br>• VEHICLE_SALE_INVOICE(机动车销售统一发票)<br>• QUOTA_INVOICE(定额发票)<br>• TOLL_INVOICE(过路过桥费发票)<br>• MEDICAL_INVOICE(医疗门诊发票)<br>• TAX_CERTIFICATE(税收完税证明)<br>• SHIP_TICKET(船票)<br>• NON_TAX_BILL(非税票据)<br>• GENERAL_MACHINE_INVOICE(通用机打发票)<br>• BUS_TICKET(汽车票)
filePathstring待识别图片的本地绝对路径。支持 jpg、png、pdf 等常见格式。

命令行调用示例

   python .claude/skills/scnet-ocr/scripts/main.py VAT_INVOICE /path/to/invoice.jpg

在 AI 对话中使用

用户可以说:

  • “帮我识别这张身份证,图片在 /Users/name/Downloads/id.jpg”
  • “提取这张发票的信息,路径是 /Users/name/Downloads/fapiao.png”
  • “OCR 这个图片里的文字,图片在 /Users/name/Desktop/text.png”

AI 会根据 description 中的关键词自动触发本技能。

AI 调用建议

为避免触发 API 速率限制(10 QPS),请串行调用本技能,即等待前一个识别完成后再发起下一个请求。 如果使用 OpenClaw 的 exec 工具,建议设置 timeout 或 yieldMs 参数,让命令同步执行,避免多个命令同时运行导致并发。

配置选项

编辑 config/.env 文件:

变量名默认值说明
SCNET_API_KEY必需Scnet API 密钥
SCNET_API_BASEhttps://api.scnet.cn/api/llm/v1API 基础地址(一般无需修改)

输出

  • 标准输出:识别结果的 JSON 数据,结构与 API 文档一致,位于 data 字段内。
  • 识别结果位于 data[0].result[0].elements 中,具体字段取决于 ocrType。
  • 错误信息:如果发生错误,会输出以 错误: 开头的友好提示。

注意事项

  • 本技能调用的 OCR API 有 10 QPS 的速率限制。
  • 如果遇到 429 错误,请等待 2-3 秒后重试,不要连续发起请求。
  • 建议在调用前确保图片已准备就绪,避免因网络问题导致重复调用。

故障排除

问题解决方案
配置文件不存在创建 config/.env 并填入 Token(参考前置配置)
API Key 无效/过期重新申请 Token 并更新 .env 文件
文件不存在检查提供的文件路径是否正确
网络连接失败检查网络连接或防火墙设置
不支持的文件类型确保文件扩展名为允许的类型(参考 API 文档)
401/403/UnauthorizedToken 无效或过期,重新申请并配置
429 Too Many Requests请求过于频繁,技能会自动等待并重试(最多 3 次)。若持续失败,请降低调用频率或联系服务方提高限额。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Invoice Scan

AI-powered invoice OCR, scanning, and data extraction. Use when: (1) user needs OCR or text extraction from invoice images, scanned documents, or PDFs, (2) s...

Registry SourceRecently Updated
4980Profile unavailable
General

feishu-doc-extended

飞书文档扩展工具,提供图片下载和 OCR 识别功能。需要配合内置 feishu 插件使用。

Registry SourceRecently Updated
3131Profile unavailable
General

claw-text-and-pics

Extract text and embedded images from scanned documents, PDFs, and photos via Mistral OCR API. Use when reading receipts, invoices, contracts, handwritten no...

Registry SourceRecently Updated
820Profile unavailable
General

WPS PDF Processing

当用户需要对 PDF 文件进行任何操作时,使用本技能。包括:读取或提取 PDF 中的文字/表格、合并多个 PDF、拆分 PDF、旋转页面、添加水印、创建新 PDF、填写 PDF 表单、加密/解密 PDF、提取图片,以及对扫描版 PDF 进行 OCR 识别使其可搜索。只要用户提到 .pdf 文件或希望生成 PDF,...

Registry SourceRecently Updated
580Profile unavailable