Markdown 重点标注
在给定 Markdown 或纯文本中识别核心结论、关键数据、术语定义、重要提示等,按类型用不同颜色背景高亮。输入为 .md 时覆盖原文件,输入为 .txt 时输出同名 .md。
使用场景
✅ 适用场景:
- 对 Markdown 文件进行重点标注
- 将纯文本转为带高亮的 Markdown
- 区分不同类型的关键词(人名、概念、数据、警告等)
❌ 不适用:
- 已经带有复杂格式的文档
- 需要保持原有样式的文件
输入格式
- Markdown (.md):直接按现有规则高亮,覆盖原文件
- 纯文本 (.txt):先转为 Markdown,再高亮,输出为同名 .md(如
doc.txt→doc.md)
纯文本转 Markdown 规则
对 .txt 输入,转换时须遵守:
- 段落:连续非空行视为一段,段间用空行分隔
- 可选结构:若某行明显为标题(单独一行、较短、无句号),可转为
##标题 - 默认:若结构不明确,整体按段落处理,不做过度推断
颜色-内容映射(必须严格执行)
通用映射
- 浅黄(#fff3cd):核心结论、主旨句、最终观点
- 浅绿(#d4edda):关键数据、数字、百分比、时间节点
- 浅蓝(#d1ecf1):定义、术语、概念、专有名词
- 浅橙(#fff2e6):重要提示、注意、必须、警告、限定条件
按文本类型的标注逻辑
根据内容自动判断文本类型,按以下逻辑调整标注重点与颜色对应:
| 文本类型 | 核心标注要素 | 颜色对应 |
|---|---|---|
| 叙事类(小说、故事、散文) | 人名、关键事件转折点、核心动机/愿望 | 人名→浅蓝;转折/主旨→浅黄;动机→浅橙 |
| 科普类(自然、生物、天文) | 主体对象、关键时间节点、核心行为/特征 | 主体→浅蓝;时间→浅绿;重要提示→浅橙 |
| 技术类(教程、工具手册) | 关键参数、核心工具/设备、安全要点 | 参数→浅绿;工具→浅蓝;安全→浅橙 |
| 说明类(规则、流程、指南) | 核心条件、关键规则、必须/禁止动作 | 规则→浅蓝;必须/禁止→浅橙 |
标记格式(唯一允许格式)
1. 文件头部
在正文首行前插入 <style> 块,定义所有高亮 class(仅一次,若已有则勿重复):
<style>
.hl-concept { background-color:#d1ecf1; padding:2px 4px; border-radius:3px; }
.hl-conclusion { background-color:#fff3cd; padding:2px 4px; border-radius:3px; }
.hl-data { background-color:#d4edda; padding:2px 4px; border-radius:3px; }
.hl-warning { background-color:#fff2e6; padding:2px 4px; border-radius:3px; }
</style>
2. 标注用法
按类型使用对应 class,禁止内联 style:
| 类型 | 颜色 | Class |
|---|---|---|
| 术语/概念/人名 | 浅蓝 | <span class="hl-concept"> |
| 结论/主旨 | 浅黄 | <span class="hl-conclusion"> |
| 数据/时间 | 浅绿 | <span class="hl-data"> |
| 重要提示 | 浅橙 | <span class="hl-warning"> |
约束规则
- 密度控制:每4~6行1个重点,单段最多3处标注;宁可少标不可多避
- 标记长度:每处仅标注2~8字的核心词/短语,禁止标注整句或长句(超过10字的一律拆成核心词或舍去)
- 完整保留原文MD结构(标题、列表、代码、链接等)
- 仅添加标记,不修改、不增删原文
- 同类型内容必须用同一种颜色
- 禁止使用==、**、*等原生MD标记
- 核心优先:仅标注对理解主干、提取关键信息必不可少的内容
- 禁止标注引述套话:如「研究表明」「我们认为」等,仅表示来源/态度,非实质结论,不标
- 禁止主观发挥:不脑补情感、不添加个人解读
- 不做延伸:仅输出标注后的原文,不添加解释、总结或提示
工作流程
- 读取用户指定的 .md 或 .txt 文件;若行数 >500,按「大文件处理」分段执行
- 若为 .txt:按「纯文本转 Markdown 规则」转为 Markdown 结构
- 在文件头部插入
<style>块(若尚不存在),在合适位置按类型添加<span class="hl-xxx">标记 - 若为 .md:写回原文件覆盖
- 若为 .txt:写入同名 .md 文件(如
foo.txt→foo.md)
大文件处理
当文件超过约 500 行时,必须分段处理:
- 分块策略:按
##、###等标题或空行分段,每块约 200~400 行 - 处理顺序:从文件开头起,逐块读取 → 标注 → 将标注后的块写回原文件对应位置
- 边界要求:每块首尾须在自然段落边界截断,不截断表格、代码块或列表行
示例
输入
徒长苗产生的原因主要是由于阳光不足、夜间温度过高以及氮肥和水分过多造成的。
输出
<style>
.hl-concept { background-color:#d1ecf1; padding:2px 4px; border-radius:3px; }
.hl-conclusion { background-color:#fff3cd; padding:2px 4px; border-radius:3px; }
.hl-data { background-color:#d4edda; padding:2px 4px; border-radius:3px; }
.hl-warning { background-color:#fff2e6; padding:2px 4px; border-radius:3px; }
</style>
<span class="hl-concept">徒长苗</span>产生的原因主要是由于<span class="hl-warning">阳光不足</span>、夜间温度过高以及氮肥和水分过多造成的。
叙事类示例(人名专色)
输入:
格罗根夫人所说的化妆间里,哈里根先生靠在椅上。老爸叫了救护车,佩特・博斯特威克和罗尼・斯米茨也来了。
输出:
<span class="hl-concept">格罗根夫人</span>所说的化妆间里,<span class="hl-concept">哈里根先生</span>靠在椅上。老爸叫了救护车,佩特・博斯特威克和罗尼・斯米茨也来了。