UniversalDocProcessor - 通用文档处理Skill

Skill概述

这是一个通用文档处理框架，支持多种格式文件的智能分析与处理，具备状态管理机制。

核心能力

多格式解析：PDF、Word、Excel、PPT、TXT、Markdown、CSV、JSON等
状态管理：WAITING_FOR_FILES → FILES_RECEIVED → EXECUTING_TASK → NEED_INFO
按需执行：收到文件不自动处理，等用户指令
信息补全：任务信息不足时先提问
多轮任务：完成一次任务后保留文件，可继续执行新任务

状态机定义

┌─────────────────────┐
│  WAITING_FOR_FILES  │ ← 初始状态
└─────────┬───────────┘
          │ 收到文件
          ▼
┌─────────────────────┐
│   FILES_RECEIVED    │ ← 文件已存储，等待指令
└─────────┬───────────┘
          │ 用户下达任务
          ▼
┌─────────────────────┐
│   EXECUTING_TASK    │ ← 执行任务中
└─────────┬───────────┘
          │ 完成/信息不足
          ▼
┌─────────────────────┐
│      NEED_INFO      │ ← 等待用户补充信息
└─────────┬───────────┘
          │ 信息补全
          ▼
      (回到EXECUTING_TASK)

处理流程

Step 1: 文件接收（WAITING_FOR_FILES → FILES_RECEIVED）

收到文件时：

解析文件内容
存储文件元信息
返回确认消息

返回话术：

已收到 {文件数量} 个文件，等待您的具体任务指令

Step 2: 任务等待（FILES_RECEIVED）

保持等待：

不主动分析
不主动处理
仅响应用户指令

用户可下达：

分析需求（"分析这份文档"、"提取关键信息"）
修改需求（"帮我修改第3段"、"整理格式"）
转换需求（"翻译成英文"、"转成PDF"）
提取需求（"提取表格"、"提取图片"）

Step 3: 信息检查（EXECUTING_TASK）

信息完整时：

执行任务
生成结果
返回文件

信息不足时：

切换到NEED_INFO状态
提问具体补充问题

Step 4: 信息补全（NEED_INFO）

用户回复后：

解析补充信息
再次检查完整性
完整则继续执行

支持的文件格式

格式	扩展名	解析能力
PDF	.pdf	文本提取、页面信息
Word	.docx, .doc	文本、表格、段落
Excel	.xlsx, .xls	数据、公式、图表
PPT	.pptx, .ppt	幻灯片、文本
文本	.txt, .log	纯文本、编码检测
Markdown	.md	结构化内容
CSV	.csv	表格数据
JSON	.json	结构化数据
其他	尝试二进制读取	基础处理

任务类型与所需信息

任务类型	必需信息	可选信息
分析	分析目标（摘要/提取/对比）	分析深度、输出格式
修改	修改内容、修改方式	格式要求、保留范围
翻译	目标语言	保留原格式、翻译风格
提取	提取内容类型	起始位置、输出格式
转换	目标格式	样式保留、页面设置

输出规范

文件输出

保持原文件格式（如需转换则生成新格式）
文件名添加后缀：_processed、_translated等

消息输出

执行前：简要说明任务计划
执行后：说明处理结果和输出文件
遇到问题：说明具体缺少什么信息

边缘情况处理

编码问题

自动检测文件编码（chardet）
检测失败时尝试UTF-8、GBK

文件过大

单文件 >50MB：分块处理
批量处理：逐个解析，避免内存溢出

解析失败

记录失败原因
返回友好提示
建议转换格式后重试

会话超时

72小时无活动：清除文件存储
用户重新发送文件：重新开始流程

使用示例

示例1: 基础分析

用户: [上传PDF文件]
Skill: 已收到1个文件，等待您的具体任务指令

用户: 帮我提取这份文档的核心要点
Skill: [执行分析任务]
      已完成分析，输出文件：xxx_summary.docx

示例2: 信息补全

用户: [上传Word文件]
Skill: 已收到1个文件，等待您的具体任务指令

用户: 帮我修改一下
Skill: 请明确告诉我：
      1. 需要修改哪些部分？（全文/指定段落/具体内容）
      2. 修改的具体要求是什么？（删除/替换/重写/格式调整）

示例3: 多轮任务

用户: [上传Excel文件]
Skill: 已收到1个文件，等待您的具体任务指令

用户: 生成这份数据的统计摘要
Skill: [执行完成] 已生成摘要文件

用户: 再帮我做个图表
Skill: [继续执行] 好的，使用已存储的文件生成图表

关键规则

不主动处理：收到文件仅存储，等指令
信息补全：任务描述模糊时先提问
保留上下文：完成任务后保留文件，支持多轮
错误友好：解析失败返回提示，不崩溃
格式保留：尽量保持原文件格式特征

universal-doc-processor

Safety Notice

Copy this and send it to your AI assistant to learn

UniversalDocProcessor - 通用文档处理Skill

Skill概述

核心能力

状态机定义

处理流程

Step 1: 文件接收（WAITING_FOR_FILES → FILES_RECEIVED）

Step 2: 任务等待（FILES_RECEIVED）

Step 3: 信息检查（EXECUTING_TASK）

Step 4: 信息补全（NEED_INFO）

支持的文件格式

任务类型与所需信息

输出规范

文件输出

消息输出

边缘情况处理

编码问题

文件过大

解析失败

会话超时

使用示例

示例1: 基础分析

示例2: 信息补全

示例3: 多轮任务

关键规则

Source Transparency

Related Skills

Img2img

Habitat-GS-Navigator

Memory Palace

Podcast Transcript Mining Authority Positioning