video-deconstruct

把一段抖音/小红书短视频拆成「故事 + 心理学」式爆款拆解报告——选题/一句话总结/内容描述/视频结构(开头-中间-结尾)/事件推进/落幕文案/受众启示/核心爆点/节奏/BGM。给运营拍同款、写脚本、做分镜时直接当弹药。当用户说"拆解视频""分析这条视频""帮我看这段抖音""短视频结构""卡点在哪""这条爆款怎么火的"时触发。输入:本地 mp4 文件路径。输出:output/ 目录下一份 markdown 报告 + 一份原始 JSON。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "video-deconstruct" with this command: npx skills add jack-yang-ai/video-deconstruct

video-deconstruct (v2.0)

这个 skill 干啥

扔一段 mp4,吐一份叙事式爆款拆解报告。覆盖 10 个章节:

  1. 选题介绍 — 一句话主题(≤ 12 字,可直接进选题库)
  2. 一句话总结 — 主角关系 + 核心冲突 + 结局(≤ 100 字)
  3. 内容描述 — 按时间线复述剧情,含转场+心理动机+元注释(300–600 字)
  4. 视频结构分析 — 开头/中间/结尾各自的"设计点 + 效果分析"
  5. 中间事件推进过程 — 3–8 条具体事件,每条"动作 + 隐含矛盾"
  6. 视频结尾 + 落幕文案 — 收尾设计 + 字幕原文 + 受众启示
  7. 核心爆点 — 为什么会火,必须涉及底层心理机制(120–250 字)
  8. 节奏(辅助)— 时间轴段落表,钩子/铺垫/转折/高潮/收尾
  9. BGM(辅助)— 卡点位置、换歌点(纯视觉推断)
  10. 评论区 — v1 跳过,v2 接入

快速开始

export STEP_API_KEY=sk-xxx
python scripts/analyze.py /path/to/your-video.mp4
# 报告生成在 ./output/your-video-report.md

# 强烈推荐:启用 ASR 把对白也喂进去
python scripts/analyze.py /path/to/your-video.mp4 --with-asr

详细步骤见 guides/01-quickstart.md

想改输出风格?

  • prompts/analysis_rubric.txt 的字段定义/写作风格指引
  • prompts/system.txt 改 AI 的角色设定(默认是"资深拆解师")
  • templates/report.md.j2 调整报告版式
  • 详见 guides/03-prompt-engineering.md

与 StepClaw Agent 框架的衔接

  • manifest.json 已声明 entry / inputs / outputs / triggers / models,可被 StepClaw Agent 直接 dispatch
  • 默认 STEP_API_KEY 走环境变量或 skill 根目录的 .env
  • 输出路径 output/{video_stem}-{report.md, analysis.json} 是固定 schema,下游 Agent 可直接读取
  • ASR 与 vision 模型都走 https://api.stepfun.com/v1,不需要额外 endpoint

限制

  • 输入必须是 mp4。默认 128MB 以内直传 StepFun 文件 API;只有超过 128MB 才会自动两遍 ffmpeg 压缩(长视频可能降到 240p/低帧率,但 rubric 仍能分析节奏/卡点/事件;详见 scripts/compress.py
  • 没有对视频长度的硬限制,但超过 128MB 后会进入压缩兜底:3 分钟内通常可保 480p+,超长视频可能退化到近似 240p 幻灯片
  • 运行时会先把(必要时压缩后的)文件上传到 StepFun 云端(临时),分析完后自动删除(除非加 --keep-upload);压缩产物也会在处理完后清理
  • BGM 维度仍以视觉线索为主(详见 guides/02-叙事式拆解说明.md)。--with-asr 启用后对白文本会作为辅助上下文喂给视觉模型,但不会直接做识曲
  • 真识曲不做(要的话改成 ACRCloud / Audd.io,见 v3 路线)

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Trio Stream Vision

Analyze any YouTube livestream or RTSP camera feed using natural language — ask what's happening, detect specific events, or get periodic summaries. Powered...

Registry SourceRecently Updated
2480Profile unavailable
General

Trio Vision

Turn any live camera into a smart camera — describe what to watch for in plain English, get alerts in your chat when it happens. Ask questions about any live...

Registry SourceRecently Updated
2590Profile unavailable
Research

Douyin Video Skills

抖音视频搜索、筛选、链接获取、文案提取与修正工具。支持在抖音网页中登录后搜索自定义关键词,按筛选参数从搜索结果中选择合适视频;点开候选视频后先校验当前弹层标题与目标搜索结果标题是否一致,若不一致则自动关闭弹层并继续尝试后续候选,再提取视频语音文案并输出原始稿、修正版、修正说明。适用场景包括抖音二次创作前的素材采集...

Registry SourceRecently Updated
1120Profile unavailable
General

多平台视频图文发布助手

多平台视频图文发布助手 — 支持抖音、快手、B站、小红书、微信视频号五大平台同步发布图文和视频内容。 触发场景:"一键发布到小红书、抖音、快手、B站、视频号"、"帮我同步发多个平台"、"多平台发布视频"、"发布视频到抖音"等。 ⚠️ 本 skill 需要用户协助操作浏览器登录,所有发布操作均在用户本地浏览器中完成...

Registry SourceRecently Updated