videocut-clip-oral

口播视频转录和口误识别。生成审查稿和删除任务清单。触发词:剪口播、处理视频、识别口误

Safety Notice

This listing is imported from skills.sh public index metadata. Review upstream SKILL.md and repository scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "videocut-clip-oral" with this command: npx skills add zrt-ai-lab/opencode-skills/zrt-ai-lab-opencode-skills-videocut-clip-oral

<!-- input: 视频文件 (*.mp4) output: 转录JSON、审查稿、删除任务TodoList pos: 转录+识别,到用户审核为止 架构守护者:一旦我被修改,请同步更新: 1. ../README.md 的 Skill 清单 2. /CLAUDE.md 路由表 -->

剪口播

转录 + 口误/静音识别 → 生成审查稿

快速使用

用户: 帮我剪这个口播视频
用户: 处理一下这个视频

流程

1. FunASR 30s 分段转录(字符级时间戳)
    ↓
2. 识别口误(逐句检查)
    ↓
3. 识别微口误(VAD 检测短片段)
    ↓
4. 识别语气词(嗯/哎/诶 等)
    ↓
5. 识别静音(≥1s)
    ↓
6. 生成审查稿(时间戳驱动)
    ↓
7. 输出删除任务 TodoList
    ↓
【等待用户确认】→ 用户确认后,执行 /videocut:剪辑

⚠️ 为什么用 30s 分段

FunASR 长视频有时间戳漂移,30s 分段可避免。

进度 TodoList

启动时创建:

- [ ] 读取「转录最佳实践」→ 转录视频
- [ ] 读取「口误识别方法论」→ 识别口误
- [ ] VAD 检测微口误(短片段 < 0.5s)
- [ ] 扫描语气词(嗯/哎/诶 等)
- [ ] 识别静音(≥1s)
- [ ] 生成审查稿
- [ ] 输出删除任务清单

⚠️ 必须先读方法论再执行

阶段先读再执行
转录tips/转录最佳实践.md调用ASR
识别口误tips/口误识别方法论.md逐句分析

核心:时间戳驱动

删除任务格式

每项必须标注精确时间戳 (start-end)

口误(N处):
- [ ] 1. `(start-end)` 删"错误文本" → 保留"正确文本"

语气词(N处):
- [ ] 1. `(前字end-后字start)` 删"嗯" 上下文: XX【嗯】YY

静音(N处):
- [ ] 1. `(start-end)` 静音Xs

口误类型

类型示例删除策略
重复型拉满新拉满只删差异("新")
替换型AI就是AI就会删第一个完整版本("AI就是")
卡顿型听会会删第一个重复字

⚠️ 关键规则

  1. 时间戳驱动:审查稿直接标注时间戳,剪辑不再搜索文本
  2. 逐token分析:对于"删前面保后面"的口误,必须逐token查时间戳
  3. 检查时间跨度:如果口误时间跨度 > 2秒,必有静音,需拆分

输出文件

01-xxx-v1_transcript.json  # 转录结果(含时间戳)
01-xxx-v1_审查稿.md        # 口误审查稿

展示要求

生成审查稿后,必须展示给用户

  1. 写入文件 01-xxx-v1_审查稿.md
  2. 读取并展示内容
  3. 等待用户确认要删除哪些项目

方法论

详见 tips/口误识别方法论.md

  • 口误识别方法(逐句检查)
  • "删前面保后面"的精确处理
  • FunASR 时间戳对齐规则

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

Coding

auto-douyin

No summary provided by upstream source.

Repository SourceNeeds Review
Coding

videocut-subtitle

No summary provided by upstream source.

Repository SourceNeeds Review
Coding

auto-weixin-video

No summary provided by upstream source.

Repository SourceNeeds Review
Coding

image-service

No summary provided by upstream source.

Repository SourceNeeds Review