csv-wizard

交互式数据清洗 CLI,支持自动类型推断、缺失值处理、重复检测

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "csv-wizard" with this command: npx skills add antonia-sz/csv-wizard

CSV Wizard — 交互式数据清洗工具

强大的 CSV 数据清洗和转换工具,提供自动类型推断、缺失值处理、重复检测等功能。

功能特性

  • 🔍 自动类型推断(数字、日期、布尔值、分类变量)
  • 🧹 缺失值检测与多种填充策略
  • 📊 数据统计摘要与预览
  • 🔄 重复行检测与删除
  • 📝 列名标准化与重命名
  • 🎯 数据格式转换与导出

使用方法

基本清洗

/clean-csv data.csv --output clean-data.csv

交互式清洗(推荐)

/clean-csv data.csv --interactive

预览数据信息

/clean-csv data.csv --info

处理缺失值

/clean-csv data.csv --fill-missing mean --output result.csv

删除重复行

/clean-csv data.csv --drop-duplicates --output result.csv

选项说明

选项说明
--info显示数据基本信息
--preview预览前 N 行数据
--fill-missing缺失值填充策略(drop/mean/median/mode/constant)
--drop-duplicates删除重复行
--standardize-names标准化列名(snake_case)
--interactive交互式模式
--output输出文件路径

缺失值填充策略

  • drop - 删除包含缺失值的行
  • mean - 使用列均值填充(仅数值列)
  • median - 使用中位数填充(仅数值列)
  • mode - 使用众数填充
  • constant - 使用固定值填充(需配合 --fill-value

示例

# 查看数据摘要
/clean-csv sales.csv --info

# 清洗数据:删除重复行 + 填充缺失值
/clean-csv sales.csv --drop-duplicates --fill-missing median --output clean-sales.csv

# 交互式清洗
/clean-csv data.csv --interactive

# 仅标准化列名
/clean-csv data.csv --standardize-names --output output.csv

输出说明

清洗后的 CSV 文件将保留原始格式,同时:

  • 自动处理编码问题(统一为 UTF-8)
  • 移除首尾空格
  • 标准化布尔值(True/False)

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Coding

brave-api-free-search

Free Brave API alternative for OpenClaw. Completely FREE web search. Secure localhost-only deployment. Supports hidden --dev flag.

Registry SourceRecently Updated
Coding

Agent Collab Platform

Unified agent collaboration platform with shared core, automatic GitHub issue handling, intelligent message routing, and modular extensibility for PM and Dev...

Registry SourceRecently Updated
Coding

Deep Memory

One-click clone of a production-grade semantic memory system: HOT/WARM/COLD tiered storage + Qdrant vector DB + Neo4j graph DB + qwen3-embedding. Enables cro...

Registry SourceRecently Updated
Coding

Auto Document Generator

自动从代码生成技术文档,支持 Python/JavaScript/Bash,AI 增强文档质量

Registry SourceRecently Updated