图片表格数据提取
任务目标
- 本 Skill 用于:从用户上传的图片中提取表格数据
- 能力包含:图片识别、表格数据提取、数据过滤、格式转换
- 触发条件:用户需要从图片中提取表格、识别表格内容或导出数据
操作步骤
1. 检查图片上传
- 检查用户消息中是否包含图片
- 如果没有图片,提示用户:"请上传包含表格的图片"
- 如果有图片,继续下一步
2. 识别图片内容
- 识别图片内容,提取、过滤数据
- 详见 references/img-table.md
3. 输出表格格式
将提取的数据以 Markdown 表格格式输出:
| 列名1 | 列名2 | 列名3 |
|-------|-------|-------|
| 数据1 | 数据2 | 数据3 |
| 数据4 | 数据5 | 数据6 |
4. 输出CSV格式
将提取的数据以 CSV 格式输出:
列名1,列名2,列名3
数据1,数据2,数据3
数据4,数据5,数据6
CSV格式规范:
- 使用逗号分隔字段
- 如果字段包含逗号、引号或换行符,用双引号包裹
- 双引号字段内的双引号需转义为两个双引号
- 详见 references/csv-format.md
注意事项
输出方式
- 应该同时输出表格形式直接展示和CVS格式数据给用户
数据完整性
- 不修改数据:保持所有数据的原始格式和内容
- 保留表头:如果图片中有表头,必须在输出中保留
- 完整提取:提取所有可见的表格数据,不遗漏任何单元格,也不要添加任何数据
过滤规则
- 仅移除明确为"pass"(不区分大小写)、“通过”的单元格
- 不移除空单元格(除非原表格中没有)
- 不移除其他数据
格式要求
- 表格格式:使用标准 Markdown 表格语法
- CSV格式:遵循标准CSV规范,确保可被电子表格软件正确解析
- 两种格式的数据内容应完全一致