HCP结果提取
当 HCP 结果文件遵循 hcp_dataextract/ 中样例的导出结构时,使用这个 skill。
功能说明
- 读取
.xlsx工作簿,以及 UTF-16 制表符分隔的.xls导出文件。 - 从第一个 sheet 或原始导出文本中解析
Group:分段。 - 提取
Sample、MeanResult或Meanresult、CV%或CV。 - 按样例布局生成新的汇总 sheet,起始位置为第
C列、第4行。 - 仅对生成的汇总 sheet 设置背景色:分组行、表头行、分组后的空白行用浅蓝色,数据行用淡绿色。
使用命令
运行内置脚本:
python scripts/extract_hcp.py <input-path>
常用参数:
--output-dir <dir>:将处理结果写入指定目录。--sheet-name <name>:指定生成的汇总 sheet 名称,默认是Sheet1。--overwrite:若输出文件已存在则覆盖。
输入路径既可以是单个文件,也可以是目录。若传入目录,脚本会扫描其中的 .xlsx、.xlsm、.xls 文件。
输出行为
- 对
.xlsx和.xlsm文件,脚本会复制原工作簿,替换或创建汇总 sheet,并另存为以_extracted.xlsx结尾的新文件。 - 对 UTF-16 文本形式的
.xls导出文件,脚本会生成新的.xlsx工作簿,其中:- 第 1 个 sheet:导入后的原始数据
- 第 2 个 sheet:提取后的汇总表
- 第一个 sheet 的原始数据不设置颜色,只有第二个 sheet 的汇总表会应用背景色。
说明
- 解析逻辑基于表头名称而不是固定列号,因此兼容
MeanResult/Meanresult以及CV%/CV。 - 会忽略空白续行,只提取每个样本的主记录行。
- 只有汇总 sheet 会设置样式,原始数据的第一个 sheet 不做颜色处理。
- 汇总 sheet 的样式与样例保持一致:分组行、表头行、分组后的空白行使用浅蓝色,数据行使用淡绿色。