excel-auto-cleaner

Excel 数据自动清洗引擎 — 自动去重、格式统一、缺失值处理、智能分类、交叉验证。 拖进去一份脏数据,出来一份干净能用的报表。支持 CSV/XLSX/JSON 多格式。 适合财务、运营、数据分析师、电商卖家。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "excel-auto-cleaner" with this command: npx skills add lijinhao123-dot/excel-auto-cleaner-pro

Excel 数据自动清洗引擎

别再手动清理数据了,AI 比你快 100 倍

能做什么

  • 🧹 自动去重 — 按单列或多列去重,智能识别相似重复
  • 📐 格式统一 — 日期/电话/地址/金额...自动标准化
  • 🔧 缺失值处理 — 智能填充/标记/删除空值
  • 🏷️ 智能分类 — 根据内容自动打标签/归类
  • 交叉验证 — 检查数据逻辑(比如金额=单价×数量)
  • 📊 输出报表 — 生成清洗前后对比 + 数据质量评分

触发方式

用户说以下任意关键词时加载此技能:

  • "清洗数据" "整理表格" "处理 Excel"
  • "去重" "数据太乱" "帮我看这个表"

使用流程

第一步:读数据

让用户提供文件路径或粘贴数据。

  • read 直接读文件(CSV/TXT/JSON)
  • Excel 用 Python openpyxl 解析

第二步:体检报告

自动扫描并输出数据质量报告:

📊 数据体检报告
━━━━━━━━━━━━━━━
总行数:12,847
总列数:18
重复行:342 (2.7%)
缺失值:156 处
   - 价格列:23 个空值
   - 日期列:89 个格式错误
   - 手机号列:44 个不规范
异常值:12 处(价格负数、日期未来)
数据质量分:82/100 ⚠️

第三步:自动清洗

按发现的问题逐项处理:

  1. 去重 — 保留第一条或按业务规则合并
  2. 日期标准化 — 统一为 YYYY-MM-DD 格式
  3. 电话标准化 — 统一为纯数字或格式化
  4. 金额清洗 — 去除货币符号/空格,统一小数位
  5. 空值处理 — 数值列填中位数、分类列填"未知"
  6. 异常值标记 — 标记可疑数据但不删除

第四步:输出清洗结果

保存清洗后的文件:

  • 原文件名_cleaned.xlsx(干净数据)
  • 原文件名_report.md(清洗报告,记录了改了什么)

第五步:可选拓展

用户可以说:

  • "再帮我分类" → 对某列 AI 自动分类
  • "生成图表" → 自动生成柱状图/折线图/饼图
  • "导出飞书表格" → 写入飞书多维表格

工具使用

  • read — 读取原始数据文件
  • exec — 运行 Python openpyxl/pandas 处理
  • write — 写出清洗后的文件
  • web_search — 辅助数据验证(如手机号归属地)

常用清洗规则(内置)

列类型规则
手机号去空格、统一 11 位、验证格式
日期统一 YYYY-MM-DD、修复乱码日期
金额去货币符号、统一小数、检测异常
地址提取省市区、补充邮编
姓名去空格、统一大小写
身份证验证校验位、提取生日性别

客户画像

  • 做财务/报表的运营
  • 每天要处理供应商报价的采购
  • 电商卖家(批量处理订单/商品数据)
  • 数据分析新人(不想写 Python)

定价参考

本技能模板在 ClawHub 建议售价:39-69 元 搭配定制化清洗规则:129 元


由 OpenClaw 技能工厂制作 | 2026.05

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Openai

OpenAI API integration — chat completions, embeddings, image generation, audio transcription, file management, fine-tuning, and assistants via the OpenAI RES...

Registry SourceRecently Updated
General

Chief Of Staff

C-suite orchestration layer. Routes founder questions to the right advisor role(s), triggers multi-role board meetings for complex decisions, synthesizes out...

Registry SourceRecently Updated
General

Cs Onboard

Founder onboarding interview that captures company context across 7 dimensions. Invoke with /cs:setup for initial interview or /cs:update for quarterly refre...

Registry SourceRecently Updated
General

Polymarket Optimizer

Automatic parameter optimizer for polymarket-executor. Reads performance_metrics.json every 6 hours, analyzes win rates and P&L per strategy, adjusts learned...

Registry SourceRecently Updated