多平台违禁词查询
执行任意检测任务前,须先读取并严格遵循同目录下的 references/core_workflow.md(输出模板、write_file 规则、字数分批与暂停交互等均在该文件中定稿)。脚本在 skill 根目录执行:python scripts/extract_text.py、python scripts/check_sensitive_words.py。
简介
面向需要在微信公号、小红书、抖音侧发稿前做一轮「平台口径」把关的运营、编导与品牌文案。
通过本 Skill,你可以:
- 按平台口径校验:同一篇稿子可选公众号 / 小红书 / 抖音(未指明时默认公众号),与接口约定平台名一致。
- 结构化交付:命中词在原文中标红;表格给出替换词与理由;通过替换得到一版保留语气与结构的改写稿。
- 多来源入稿:支持直接粘贴、txt、图片内文字(仅 OCR,不解读画面)、以及网页正文抓取(含常见 SSR/动态页场景,以脚本为准)。
适用于活动推文、种草脚本、短视频字幕稿、落地页文案等发稿前的自检环节。
功能特性
核心能力
- 三平台规则:公众号、小红书、抖音三套检测维度;默认公众号。
- 三类输入:纯文本;图片 / txt(图片仅提取文字);URL 自动拉正文再检。
- 检出即落盘:命中违禁词时除对话内展示外,须按
core_workflow生成带四位随机后缀的【平台】_优化文案_xxxx.txt(纯文本,去掉 HTML 标记)。 - 长文策略:单次建议 ≤3000 字;3001–10000 字须停下让用户选单次首段 / 分批 / 取消;超过 10000 字不予自动跑全量(见工作流)。
特色
- 网页正文:
extract_text.py覆盖常见前端渲染页面,减少「只有壳没有字」的漏检。 - 分批切割:超长文本优先在句号、逗号等处断开,降低截断词中的概率。
- 零命中短路:
word_count=0时只回复合规结论,不生成文件、不展开替换表。
使用指南
基础路径(3 步)
第 1 步:确认平台与素材
用户应说明平台(或接受默认公众号),并给出其一:粘贴正文、上传 txt/图片、或网页链接。
未指定平台时:默认公众号,可在首轮简要告知。
用户:小红书|这款面霜用完一周真的换脸 助手:按小红书规则检测;若命中则按
core_workflow三板块输出,并写入小红书_优化文案_xxxx.txt。
第 2 步:字数与分批
提取全文后先数字数。≤3000:直接调用检测脚本;3001–10000:弹出标准提示并停止,等用户回复 1 / 2 / 3 后再继续;>10000:仅提示超限并终止,不调用检测。
用户:(粘贴约 5000 字) 助手:⚠ 单次建议不超过 3000 字,已超过单次执行字数,是否分批?回复 1=只检前 3000 字,2=按批检测合并结果,3=取消。
第 3 步:执行脚本与回填模板
按 core_workflow 调用 extract_text.py(如需)与 check_sensitive_words.py,解析 JSON,禁止整段粘贴原始 JSON。有命中时:套版输出 + 必须 write_file;无命中:仅合规一句话。
常用口令速查
| 用户说法示例 | 助手动作 |
|---|---|
公众号 + 正文 | 默认路径检测;命中则套版 + 写文件 |
抖音 + URL | 先抓网页正文再检 |
| 仅 URL / 仅上传文件 | 识别来源 → 抽文本 → 默认公众号(除非文中写明平台) |
超长文且用户回复 2 | 按约 3000 字一批(优先自然断点),分批请求后汇总 |
无法继续时:抓取失败、路径无效、或用户取消分批——说明原因并给出可操作建议(重传文件、换链接、改短后再检);不得伪造检测结果或违禁词列表。
使用场景
| 场景 | 角色 | 需求描述 | 使用方式 |
|---|---|---|---|
| 推文定稿前 | 公号运营 | 避免发送后触发敏感表述 | 选公众号;粘贴终稿或网页预览链接;按输出修改 |
| 种草笔记 | 小红书运营 | 标题与正文规避平台禁用词 | 指定小红书;贴全文或传 txt;对照替换表改稿 |
| 短视频脚本 | 编导 / 剪辑 | 字幕与口播合规 | 指定抖音;贴脚本或海报 OCR;合并批量结果(长稿) |
| 活动落地页 | 品牌文案 | H5/官网段落一次性过检 | 贴 URL;默认或指定平台;检出则下载 txt 优化稿 |
注意事项与边界
- 查询结果:API 返回仅供自查;对外口径仍以企业经营范围、产品真实功效及平台最新规则为准(见工作流中的数据说明文案)。
- 图片:只识别图中文字,不描述画风、人物、场景或品牌视觉。
- 文件格式:支持图片与 txt;不支持 PDF、Word;若用户上传,应明确告知并建议导出为 txt 或粘贴正文。
- 交付:对话里展示结构化结果;完整优化纯文本仅以文件交付,步骤与命名以
core_workflow为准,遗漏write_file视为未完成本 Skill。