CSV Wizard — 交互式数据清洗工具
强大的 CSV 数据清洗和转换工具,提供自动类型推断、缺失值处理、重复检测等功能。
功能特性
- 🔍 自动类型推断(数字、日期、布尔值、分类变量)
- 🧹 缺失值检测与多种填充策略
- 📊 数据统计摘要与预览
- 🔄 重复行检测与删除
- 📝 列名标准化与重命名
- 🎯 数据格式转换与导出
使用方法
基本清洗
/clean-csv data.csv --output clean-data.csv
交互式清洗(推荐)
/clean-csv data.csv --interactive
预览数据信息
/clean-csv data.csv --info
处理缺失值
/clean-csv data.csv --fill-missing mean --output result.csv
删除重复行
/clean-csv data.csv --drop-duplicates --output result.csv
选项说明
| 选项 | 说明 |
|---|---|
--info | 显示数据基本信息 |
--preview | 预览前 N 行数据 |
--fill-missing | 缺失值填充策略(drop/mean/median/mode/constant) |
--drop-duplicates | 删除重复行 |
--standardize-names | 标准化列名(snake_case) |
--interactive | 交互式模式 |
--output | 输出文件路径 |
缺失值填充策略
drop- 删除包含缺失值的行mean- 使用列均值填充(仅数值列)median- 使用中位数填充(仅数值列)mode- 使用众数填充constant- 使用固定值填充(需配合--fill-value)
示例
# 查看数据摘要
/clean-csv sales.csv --info
# 清洗数据:删除重复行 + 填充缺失值
/clean-csv sales.csv --drop-duplicates --fill-missing median --output clean-sales.csv
# 交互式清洗
/clean-csv data.csv --interactive
# 仅标准化列名
/clean-csv data.csv --standardize-names --output output.csv
输出说明
清洗后的 CSV 文件将保留原始格式,同时:
- 自动处理编码问题(统一为 UTF-8)
- 移除首尾空格
- 标准化布尔值(True/False)