小红书违禁词合规检测
-
小红书专属违禁词库:区别于通用广告法检测,词库针对小红书审核规则专项优化,覆盖平台特有的敏感词、限流词、隐形违规词
-
实时同步审核规则:小红书审核标准频繁调整,词库持续更新,确保与最新规则对齐,不会拿过时的词库糊弄你
-
智能语义过滤:自动识别英文误匹配,减少误判干扰,结果更精准
-
三种输入方式一站式检测:支持文本直接输入、文件上传(TXT/DOC/DOCX/图片)、网页URL检测,不需要多次切换工具
-
替换建议+优化文案输出:提供上下文适配的替换词,保持文案节奏和流畅度,不是简单删掉导致语句不通
正式跑检测与输出前,须先打开并严格执行同目录 references/core_workflow.md(字数阈值、分批追问话术、三板块输出模板、优化稿落盘与文件卡片等均以该文件为唯一细则)。
简介
面向在小红书生态内产出图文、商品详情与营销物料的团队与个人,在发布前做一次平台向的违禁词扫描,降低删稿、限流与审核驳回带来的返工成本。
通过本 Skill,你可以:
- 定位风险用语:在原文语境中标出疑似违禁片段,避免只看「词表」却忽略上下文。
- 拿到可执行的改法:每张表给出替换词与简要理由;正文级输出只做「必要的词级替换」,不整段改写语气。
- 沉淀可投递版本:除对话内富文本外,另生成去除 HTML 的纯文本优化稿文件,便于同步给设计、投放或法务留档。
适用于品牌小红书运营、电商详情文案、MCN 审稿、独立创作者自查等角色。运行依赖 Python 环境与脚本所列包;网页抓取侧需本机已安装 Chromium(见 frontmatter dependency)。
功能特性
核心能力
- 多形态输入:直接粘贴正文;上传 TXT / DOC / DOCX;提供 URL 拉取页面正文;图片先 OCR 再送检(流程见核心工作流)。
- 检测结果结构化输出:平台固定为小红书;给出命中数量、类型汇总;违禁片段在原文中高亮标红。
- 替换级改写:表格列出「违禁词 → 替换词 → 理由」;优化正文仅替换命中部分并可做最小限度的连接词润色,保持原有口吻与版式意图。
- 交付物闭环:检出违禁词时,按规范写入
./小红书_优化文案_{随机六位}.txt并以文件卡片交付用户。
规则要点(与执行脚本一致)
- 单次建议篇幅 ≤3000 字;3001–10000 字须按核心工作流向用户确认「仅检前 3000 / 分批全检 / 取消」;>10000 字默认中止自动检测并提示用户自行拆分。
--content/--file/--url每次仅择一;平台不可切换。- 不支持 PDF:需用户转为图片或可复制文本后再检。
使用指南
基础路径
加载细则
打开 references/core_workflow.md,按其中「操作步骤—输出模板—输出格式铁律—注意事项」逐项执行。禁止用本 SKILL 的摘要代替该文件全文。
第 1 步:确认输入形态
判断用户给出的是纯文本、本地文本类文件、网页链接还是图片。缺文件路径、链接无效或图片无法识别文字时,说明缺口并请用户补齐;勿臆造正文。
第 2 步:提取与字数判定
- 文本:先统计字符数,再决定是否直接调用脚本或进入分批询问。
- 文件 / URL:先用
--extract-only取全文与length,再按阈值分支。 - 图片:仅提取图中文字(不做画面描述),再等同文本流程处理字数。
第 3 步:调用检测脚本
在工作区根目录执行(路径按用户实际文件替换):
python scripts/check_sensitive_words.py --content="……"
python scripts/check_sensitive_words.py --file=/path/to/doc.docx
python scripts/check_sensitive_words.py --url=https://example.com --extract-only
完整参数语义与互斥关系见下文「脚本与参数速查」。
第 4 步:解析 JSON 并按模板回复
严格使用 core_workflow.md 中的三板块模板;word_count=0 时的精简输出规则亦以该文件为准。分批检测时,每批按模板输出,最终在一份汇总优化稿文件中合并全文顺序。
对话示例
用户:帮我看下这段笔记有没有违禁词:「……」 助手:已按小红书规则送检;以下为检测结果 / 替换建议 / 建议优化文案(结构固定)。随后附上纯文本优化稿文件卡片。
用户:这个 Word 里的文案能检吗?(上传
brief.docx) 助手:先--extract-only抽取字数;若在 3001–10000 区间,会先发送标准分批询问话术,待你选择 1/2/3 后再继续。
脚本与参数速查
| 用法 | 说明 |
|---|---|
--content="..." | 直接传入待检正文(与 --file、--url 互斥) |
--file=/path/to/file | 从 TXT/DOC/DOCX 抽取正文再检 |
--url=https://… | 拉取网页正文再检;动态页优先 Playwright,失败则回退静态抓取 |
--extract-only | 仅返回正文与 length,不触发违禁词接口;用于字数分支判断 |
失败或不宜继续时:超过 10000 字、用户选取消、PDF 上传、或脚本/网络连续不可用——按 core_workflow.md 中的固定提示文案中止或降级,不得伪造检测结果或 JSON。
使用场景
| 场景 | 角色 | 需求描述 | 使用方式 |
|---|---|---|---|
| 发稿前风控 | 品牌/账号运营 | 笔记已形成初稿,需在发布前快速扫违禁表述 | 粘贴正文或上传 DOCX;按输出取替换表与优化稿文件 |
| 电商详情与买点 | 电商文案 | 商品卖点密集,担心功效类措辞触线 | 文件或 URL 抽取全文;超长则走分批确认 |
| 批量审稿 | MCN 审稿 / 主编 | 统一口径审核多篇口径相似的稿件 | 逐篇走脚本;汇总优化稿按批次合并规则执行 |
| 竞品落地页扒稿 | 增长 / 市场 | 参考外链文案写法同时评估合规风险 | --url 抽取后检测;注意仅作合规参考,勿照搬侵权内容 |
| 海报/截图文案 | 设计协作 | 图片内小字需 OCR 后检查 | 先 OCR 再 --content;字数逻辑与正文相同 |
注意事项与边界
- 效力声明:结果为接口与规则集的静态映射,仅供参考;是否违规以小红书当日审核与账号画像为准,不作为法律意见。
- 隐私:避免在公共日志中粘贴用户未同意外传的全文;长文本优先本地脚本处理。
- 平台范围:脚本内平台写死为小红书,不提供切换其他社区的对照检测。
- 主 Agent 约束:本 Skill 仅在主会话执行,避免子任务上下文残缺导致漏读
core_workflow.md或漏发文件卡片。 - 细则全文:字数分段话术、三板块 HTML 规则、蓝色替换标记、
word_count=0特例、文件命名与卡片发送等,一律以 references/core_workflow.md 为准。