文言压缩 · wenyan-compress
核心原则
- 压缩率优先:文言文天然是中文压缩包,每个字≈一个概念,目标压缩率 60-80%
- 可逆性优先于美感:内部存档必须能还原,所以优先用有明确映射的词
- 用户可见 vs 内部存档:对外输出可追求文辞雅驯,内部存档优先效率和可查询性
触发场景
满足任一即触发:
- 用户说"用文言文"、"文言文版"
- 用户说"帮我记录一下"、"存档"、"压缩"
- 对话超过 10 轮需要提炼
- 写入 memory/*.md 或日志文件
- 用户要求"写日记"、"总结"
两种工作模式
模式A:对外输出(给用户看)
用户需要文言文回复时,用正式文言文风格撰写,兼顾文辞优美。
格式示例:
用户问:帮我写一首诗
AI答:日出东方,照耀大地
压缩版(展示给用户):
曦耀扶桑,金轮悬空。
光被四表,万物生辉。
模式B:内部压缩(给记忆/日志用)
将任意对话内容压缩为紧凑文言文串,供存档和检索。
压缩格式:
[时间戳] 主语·事件·状态·情绪
示例:
原始对话摘要:
用户问显卡推荐,AI推荐RTX 4090,用户表示满意
压缩后:
辰时·客问显卡·吾荐4090·客悦
压缩映射表
完整映射表见 references/compress-map.md,常用摘要:
| 白话 | 文言 | 适用 |
|---|---|---|
| 用户问了/说 | 客询/客云 | 对话记录 |
| AI回复/回答 | 吾答/吾云 | 对话记录 |
| 帮我做X | 乞X | 任务请求 |
| 好的/没问题 | 诺/善 | 确认 |
| 我觉得 | 愚以为 | 意见表达 |
| 不满意/重新来 | 不满,令改之 | 重做要求 |
| 任务完成 | 事毕/功成 | 状态更新 |
| 失败了/出错了 | 败/有虞 | 错误 |
| 不知道 | 未知/未详 | 不确定 |
| 有道理 | 然/善哉 | 认同 |
| 搜索了一下 | 检得 | 查证 |
| 正在做 | 行之 | 进行中 |
| 等等/稍等 | 稍候 | 等待 |
典故速查
见 references/dict.md,常用:
- 三思 → 谨慎考虑(而非"思考三次")
- 薪火相传 → 传承/迭代
- 刻舟求剑 → 不知变通
- 画蛇添足 → 过度冗余
- 曹刿论战 → 分析局势
日志写入格式
写入 memory/ 日志时使用压缩格式:
## YYYY-MM-DD 工作日志
### 压缩摘要
辰时·客询显卡·吾荐4090·客悦
巳时·客问天气·答之
午时·客求文档·已发
注意:仅在用户明确要求压缩、或写入内部日志时使用压缩格式。用户直接看到的对话仍用正常白话。
参考文件
references/compress-map.md— 完整压缩映射表(白话→文言)references/grammar.md— 文言语法速查(虚词、句式)references/dict.md— 典故成语对照表