excel-import-helper

Excel/截图字段智能导入工具。将 Excel 数据源或截图(PDU截图)中的字段,按照固定模板格式自动导入,生成标准化的导入模板。支持中英文字段名映射、字段类型智能识别、截图 OCR 识别。适用于资产负债表、现金流量表、利润表、银行账号等财务报表批量导入场景。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "excel-import-helper" with this command: npx skills add gitxiajp/execlpngimport

Excel 导入模板智能生成器

功能说明

将 Excel 数据源或截图中的字段,按照固定模板格式自动导入,生成标准化的导入模板。

支持的数据源类型

  • Excel/CSV 文件
  • 截图/图片(PNG、JPG 等)

支持的报表类型

  • 资产负债表
  • 现金流量表
  • 利润表
  • 银行账号配置
  • 任意自定义表单

使用方法

方式一:处理 Excel 文件

用户提供:

  1. 模板文件路径
  2. 数据源 Excel 文件路径
  3. 表中文名

方式二:处理截图/图片

用户提供:

  1. 截图文件路径(支持多张截图)

系统自动完成:

  • OCR 识别截图文字
  • 提取字段名
  • 生成中英文映射
  • 识别字段类型
  • 输出模板文件

工作流程

Step 1: OCR 识别(截图场景)

from cnocr import CnOcr

ocr = CnOcr()
result = ocr.ocr('截图路径.png')

# 打印全部识别结果检查完整性
for i, item in enumerate(result, 1):
    print(f'{i}. {item["text"].strip()}')

Step 2: 字段提取与过滤

# 排除占位符
keywords_to_exclude = ['请输入', '年/月/日']

fields = []
for item in result:
    text = item['text'].strip()
    if text and not any(kw in text for kw in keywords_to_exclude):
        fields.append(text)

Step 3: 中英文字段映射

# 预定义映射库
name_mapping = {
    # 财务报表通用
    '营业收入': 'operatingRevenue',
    '营业成本': 'operatingCosts',
    '净利润': 'netProfit',
    '利润总额': 'totalProfit',
    
    # 银行账号
    '账号名称': 'accountName',
    '银行名称': 'bankName',
    '开户行': 'openingBank',
    '银行账户': 'bankAccount',
    
    # ... 更多见 scripts/field_mapping.py
}

# 自动映射,未知字段使用 field{N} 格式
eng_name = name_mapping.get(name, f'field{index+1}')

Step 4: 字段类型智能识别

def detect_field_type(name):
    amount_keywords = ['资金', '借款', '资产', '负债', '权益', '资本', 
                       '账款', '票据', '投资', '应收', '应付', '利润',
                       '费用', '收益', '收入', '成本', '税额']
    if any(kw in name for kw in amount_keywords):
        return '金额'
    
    if any(kw in name for kw in ['日期']):
        return '日期时间'
    
    if any(kw in name for kw in ['类型', '状态']):
        return '单选'
    
    return '单行文本'

Step 5: 生成模板

import openpyxl

# 读取模板
tpl_wb = openpyxl.load_workbook('Excel导入模板.xlsx')
tpl_ws = tpl_wb.active

# ⚠️ 表名放在 B1,不是 A1!
tpl_ws['B1'] = '表中文名'

# 清除旧数据
for row in range(5, tpl_ws.max_row + 1):
    for col in range(1, 6):
        tpl_ws.cell(row=row, column=col).value = None

# 写入字段
for i, name in enumerate(fields):
    row_num = i + 5
    eng_name = name_mapping.get(name, f'field{i+1}')
    field_type = detect_field_type(name)
    
    tpl_ws.cell(row=row_num, column=1, value=name)
    tpl_ws.cell(row=row_num, column=2, value=eng_name)
    tpl_ws.cell(row=row_num, column=3, value=field_type)
    tpl_ws.cell(row=row_num, column=4, value='否')

# 保存
tpl_wb.save('输出模板.xlsx')

标准模板结构

行1: A1='表中文名' | B1=实际表名
行2: A2='表英文名' | B2=entityName
行3: A3='说明'
行4: 字段中文名 | 字段英文名 | 字段类型 | 是否必填 | 字段说明
行5+: 字段数据行

字段类型说明

类型识别关键词说明
金额资金、资产、负债、收入、成本、利润等财务数值
日期时间日期、时间日期格式
单选类型、状态下拉选项
状态标签状态状态显示
单行文本其他普通文本

环境依赖

pip install openpyxl cnocr

注意事项

  1. 表名位置:表名必须填在 B1,A1 保持"表中文名"
  2. OCR 完整性:识别后检查全部结果,不能遗漏任何区域
  3. 残留清除:每次生成前清除第5行及之后所有旧数据
  4. 结果验证:生成后检查前25行确认无误

故障排除

cnocr 首次运行慢

首次运行会自动下载模型,后续会快很多。

OCR 识别不准确

  • 确保截图清晰
  • 避免文字与背景颜色相近
  • 文字方向保持正向

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

iFinD Excel Plugin

iFinD 同花顺 Excel 插件函数参考手册,包含股票、港股、美股、债券、基金、期货等全部金融数据指标的函数表达式、参数代码和使用说明。生成 Excel 数据文件时可参考此 skill 的指标描述。

Registry SourceRecently Updated
30Profile unavailable
General

Meiguang Car Insurance

车险保单PDF字段提取工具 v5.0.2(美光/大地/太平洋/浙商/亚太/人保/华海)。输入PDF文件夹,输出Excel。支持14字段,含车辆使用性质多数纠正、PDAA/PDZA表格兜底、Excel中文UTF-8编码修复。

Registry SourceRecently Updated
1861Profile unavailable
General

Invoice Scan

AI-powered invoice OCR, scanning, and data extraction. Use when: (1) user needs OCR or text extraction from invoice images, scanned documents, or PDFs, (2) s...

Registry SourceRecently Updated
4980Profile unavailable
General

feishu-doc-extended

飞书文档扩展工具,提供图片下载和 OCR 识别功能。需要配合内置 feishu 插件使用。

Registry SourceRecently Updated
3141Profile unavailable
excel-import-helper | V50.AI