Excel Parser Skill
Excel Parser技能用于从Excel文件中提取内容,支持多种Excel格式。
Compatibility
- Python 3.7+
- 依赖:
python-dotenv,python-calamine - 备选依赖:
xlrd(用于.xls文件),openpyxl(用于.xlsx文件)
使用方法
基本使用
from excel_parser import ExcelParser, process_excel
# 方法1: 使用ExcelParser类
parser = ExcelParser()
result = parser.parse_excel('path/to/file.xlsx')
# 方法2: 使用便捷函数
result = process_excel('path/to/file.xlsx')
# 获取文本格式输出
text = parser.parse_excel_to_text('path/to/file.xlsx')
返回结果格式
{
"text": "格式化的文本内容",
"sheets": [
{
"name": "Sheet1",
"rows": [["A1", "B1"], ["A2", "B2"]],
"row_count": 2,
"column_count": 2
}
],
"sheet_count": 1,
"total_cells": 4,
"engine": "python-calamine"
}
支持的文件格式
- .xls (Excel 97-2003)
- .xlsx, .xlsm (Excel 2007+)
- .xltx, .xltm (Excel模板)
环境变量配置
创建 .env 文件:
# 最大行数限制,默认100行
EXCEL_MAX_ROWS=100
# 是否保留空行,默认false
EXCEL_KEEP_EMPTY_ROWS=false
详细文档
更多使用示例和故障排除信息,参见 README.md。