小红书违禁词合规检测

小红书专属违禁词库：区别于通用广告法检测，词库针对小红书审核规则专项优化，覆盖平台特有的敏感词、限流词、隐形违规词
实时同步审核规则：小红书审核标准频繁调整，词库持续更新，确保与最新规则对齐，不会拿过时的词库糊弄你
智能语义过滤：自动识别英文误匹配，减少误判干扰，结果更精准
三种输入方式一站式检测：支持文本直接输入、文件上传（TXT/DOC/DOCX/图片）、网页URL检测，不需要多次切换工具
替换建议+优化文案输出：提供上下文适配的替换词，保持文案节奏和流畅度，不是简单删掉导致语句不通

正式跑检测与输出前，须先打开并严格执行同目录 references/core_workflow.md（字数阈值、分批追问话术、三板块输出模板、优化稿落盘与文件卡片等均以该文件为唯一细则）。

简介

面向在小红书生态内产出图文、商品详情与营销物料的团队与个人，在发布前做一次平台向的违禁词扫描，降低删稿、限流与审核驳回带来的返工成本。

通过本 Skill，你可以：

定位风险用语：在原文语境中标出疑似违禁片段，避免只看「词表」却忽略上下文。
拿到可执行的改法：每张表给出替换词与简要理由；正文级输出只做「必要的词级替换」，不整段改写语气。
沉淀可投递版本：除对话内富文本外，另生成去除 HTML 的纯文本优化稿文件，便于同步给设计、投放或法务留档。

适用于品牌小红书运营、电商详情文案、MCN 审稿、独立创作者自查等角色。运行依赖 Python 环境与脚本所列包；网页抓取侧需本机已安装 Chromium（见 frontmatter dependency）。

功能特性

核心能力

多形态输入：直接粘贴正文；上传 TXT / DOC / DOCX；提供 URL 拉取页面正文；图片先 OCR 再送检（流程见核心工作流）。
检测结果结构化输出：平台固定为小红书；给出命中数量、类型汇总；违禁片段在原文中高亮标红。
替换级改写：表格列出「违禁词 → 替换词 → 理由」；优化正文仅替换命中部分并可做最小限度的连接词润色，保持原有口吻与版式意图。
交付物闭环：检出违禁词时，按规范写入 ./小红书_优化文案_{随机六位}.txt 并以文件卡片交付用户。

规则要点（与执行脚本一致）

单次建议篇幅 ≤3000 字；3001–10000 字须按核心工作流向用户确认「仅检前 3000 / 分批全检 / 取消」；>10000 字默认中止自动检测并提示用户自行拆分。
--content / --file / --url 每次仅择一；平台不可切换。
不支持 PDF：需用户转为图片或可复制文本后再检。

使用指南

基础路径

加载细则

打开 references/core_workflow.md，按其中「操作步骤—输出模板—输出格式铁律—注意事项」逐项执行。禁止用本 SKILL 的摘要代替该文件全文。

第 1 步：确认输入形态

判断用户给出的是纯文本、本地文本类文件、网页链接还是图片。缺文件路径、链接无效或图片无法识别文字时，说明缺口并请用户补齐；勿臆造正文。

第 2 步：提取与字数判定

文本：先统计字符数，再决定是否直接调用脚本或进入分批询问。
文件 / URL：先用 --extract-only 取全文与 length，再按阈值分支。
图片：仅提取图中文字（不做画面描述），再等同文本流程处理字数。

第 3 步：调用检测脚本

在工作区根目录执行（路径按用户实际文件替换）：

python scripts/check_sensitive_words.py --content="……"
python scripts/check_sensitive_words.py --file=/path/to/doc.docx
python scripts/check_sensitive_words.py --url=https://example.com --extract-only

完整参数语义与互斥关系见下文「脚本与参数速查」。

第 4 步：解析 JSON 并按模板回复

严格使用 core_workflow.md 中的三板块模板；word_count=0 时的精简输出规则亦以该文件为准。分批检测时，每批按模板输出，最终在一份汇总优化稿文件中合并全文顺序。

对话示例

用户：帮我看下这段笔记有没有违禁词：「……」助手：已按小红书规则送检；以下为检测结果 / 替换建议 / 建议优化文案（结构固定）。随后附上纯文本优化稿文件卡片。

用户：这个 Word 里的文案能检吗？（上传 brief.docx）助手：先 --extract-only 抽取字数；若在 3001–10000 区间，会先发送标准分批询问话术，待你选择 1/2/3 后再继续。

脚本与参数速查

用法	说明
`--content="..."`	直接传入待检正文（与 `--file`、`--url` 互斥）
`--file=/path/to/file`	从 TXT/DOC/DOCX 抽取正文再检
`--url=https://…`	拉取网页正文再检；动态页优先 Playwright，失败则回退静态抓取
`--extract-only`	仅返回正文与 `length`，不触发违禁词接口；用于字数分支判断

失败或不宜继续时：超过 10000 字、用户选取消、PDF 上传、或脚本/网络连续不可用——按 core_workflow.md 中的固定提示文案中止或降级，不得伪造检测结果或 JSON。

使用场景

场景	角色	需求描述	使用方式
发稿前风控	品牌/账号运营	笔记已形成初稿，需在发布前快速扫违禁表述	粘贴正文或上传 DOCX；按输出取替换表与优化稿文件
电商详情与买点	电商文案	商品卖点密集，担心功效类措辞触线	文件或 URL 抽取全文；超长则走分批确认
批量审稿	MCN 审稿 / 主编	统一口径审核多篇口径相似的稿件	逐篇走脚本；汇总优化稿按批次合并规则执行
竞品落地页扒稿	增长 / 市场	参考外链文案写法同时评估合规风险	`--url` 抽取后检测；注意仅作合规参考，勿照搬侵权内容
海报/截图文案	设计协作	图片内小字需 OCR 后检查	先 OCR 再 `--content`；字数逻辑与正文相同

注意事项与边界

效力声明：结果为接口与规则集的静态映射，仅供参考；是否违规以小红书当日审核与账号画像为准，不作为法律意见。
隐私：避免在公共日志中粘贴用户未同意外传的全文；长文本优先本地脚本处理。
平台范围：脚本内平台写死为小红书，不提供切换其他社区的对照检测。
主 Agent 约束：本 Skill 仅在主会话执行，避免子任务上下文残缺导致漏读 core_workflow.md 或漏发文件卡片。
细则全文：字数分段话术、三板块 HTML 规则、蓝色替换标记、word_count=0 特例、文件命名与卡片发送等，一律以 references/core_workflow.md 为准。

资源索引

检测脚本：scripts/check_sensitive_words.py

xhs-prohibited-word

Safety Notice

Copy this and send it to your AI assistant to learn