prohibited-word-query

当用户需要核对公众号、小红书或抖音文案是否踩平台违禁词,或要从本地文本/图片/网页中抽取内容做合规检查时启用; 能力摘要:按平台规则拉取命中词、标红原文、给出可替换表述与改写稿,并可在检出违规时落盘优化版纯文本。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "prohibited-word-query" with this command: npx skills add if530770/prohibited-word-query

多平台违禁词查询

执行任意检测任务前,须先读取并严格遵循同目录下的 references/core_workflow.md(输出模板、write_file 规则、字数分批与暂停交互等均在该文件中定稿)。脚本在 skill 根目录执行:python scripts/extract_text.pypython scripts/check_sensitive_words.py

简介

面向需要在微信公号、小红书、抖音侧发稿前做一轮「平台口径」把关的运营、编导与品牌文案。

通过本 Skill,你可以:

  • 按平台口径校验:同一篇稿子可选公众号 / 小红书 / 抖音(未指明时默认公众号),与接口约定平台名一致。
  • 结构化交付:命中词在原文中标红;表格给出替换词与理由;通过替换得到一版保留语气与结构的改写稿。
  • 多来源入稿:支持直接粘贴、txt、图片内文字(仅 OCR,不解读画面)、以及网页正文抓取(含常见 SSR/动态页场景,以脚本为准)。

适用于活动推文、种草脚本、短视频字幕稿、落地页文案等发稿前的自检环节。

功能特性

核心能力

  • 三平台规则:公众号、小红书、抖音三套检测维度;默认公众号。
  • 三类输入:纯文本;图片 / txt(图片仅提取文字);URL 自动拉正文再检。
  • 检出即落盘:命中违禁词时除对话内展示外,须按 core_workflow 生成带四位随机后缀的 【平台】_优化文案_xxxx.txt(纯文本,去掉 HTML 标记)。
  • 长文策略:单次建议 ≤3000 字;3001–10000 字须停下让用户选单次首段 / 分批 / 取消;超过 10000 字不予自动跑全量(见工作流)。

特色

  • 网页正文extract_text.py 覆盖常见前端渲染页面,减少「只有壳没有字」的漏检。
  • 分批切割:超长文本优先在句号、逗号等处断开,降低截断词中的概率。
  • 零命中短路word_count=0 时只回复合规结论,不生成文件、不展开替换表。

使用指南

基础路径(3 步)

第 1 步:确认平台与素材

用户应说明平台(或接受默认公众号),并给出其一:粘贴正文、上传 txt/图片、或网页链接。

未指定平台时:默认公众号,可在首轮简要告知。

用户:小红书|这款面霜用完一周真的换脸 助手:按小红书规则检测;若命中则按 core_workflow 三板块输出,并写入 小红书_优化文案_xxxx.txt

第 2 步:字数与分批

提取全文后先数字数。≤3000:直接调用检测脚本;3001–10000:弹出标准提示并停止,等用户回复 1 / 2 / 3 后再继续;>10000:仅提示超限并终止,不调用检测。

用户:(粘贴约 5000 字) 助手:⚠ 单次建议不超过 3000 字,已超过单次执行字数,是否分批?回复 1=只检前 3000 字,2=按批检测合并结果,3=取消。

第 3 步:执行脚本与回填模板

core_workflow 调用 extract_text.py(如需)与 check_sensitive_words.py,解析 JSON,禁止整段粘贴原始 JSON。有命中时:套版输出 + 必须 write_file;无命中:仅合规一句话。

常用口令速查

用户说法示例助手动作
公众号 + 正文默认路径检测;命中则套版 + 写文件
抖音 + URL先抓网页正文再检
仅 URL / 仅上传文件识别来源 → 抽文本 → 默认公众号(除非文中写明平台)
超长文且用户回复 2按约 3000 字一批(优先自然断点),分批请求后汇总

无法继续时:抓取失败、路径无效、或用户取消分批——说明原因并给出可操作建议(重传文件、换链接、改短后再检);不得伪造检测结果或违禁词列表。

使用场景

场景角色需求描述使用方式
推文定稿前公号运营避免发送后触发敏感表述选公众号;粘贴终稿或网页预览链接;按输出修改
种草笔记小红书运营标题与正文规避平台禁用词指定小红书;贴全文或传 txt;对照替换表改稿
短视频脚本编导 / 剪辑字幕与口播合规指定抖音;贴脚本或海报 OCR;合并批量结果(长稿)
活动落地页品牌文案H5/官网段落一次性过检贴 URL;默认或指定平台;检出则下载 txt 优化稿

注意事项与边界

  • 查询结果:API 返回仅供自查;对外口径仍以企业经营范围、产品真实功效及平台最新规则为准(见工作流中的数据说明文案)。
  • 图片:只识别图中文字,不描述画风、人物、场景或品牌视觉。
  • 文件格式:支持图片与 txt;不支持 PDF、Word;若用户上传,应明确告知并建议导出为 txt 或粘贴正文。
  • 交付:对话里展示结构化结果;完整优化纯文本仅以文件交付,步骤与命名以 core_workflow 为准,遗漏 write_file 视为未完成本 Skill。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Dex

Manage your Dex personal CRM — search, create, and update contacts, log interaction notes, set follow-up reminders, organize contacts with tags and groups, a...

Registry SourceRecently Updated
5620ocruzv
General

pumpmarket skill

Predict pump.fun token graduations (YES/NO) on Solana mainnet via PumpMarket parimutuel betting markets.

Registry SourceRecently Updated
General

maxhub-weibo

微博/Weibo平台微博热搜、话题、用户与博文数据采集。当用户提到微博、weibo、热搜、超话、话题等相关需求时激活此Skill。

Registry SourceRecently Updated
General

Context Resume

Reconstructs your full working context when you return to a task after an interruption — meeting, lunch, sleep, weekend, or three-week vacation. Not session...

Registry SourceRecently Updated