video-transcribe-v1-0-3

本地视频转文字 - 使用 OpenAI Whisper 进行语音识别,完全免费、离线运行、保护隐私

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "video-transcribe-v1-0-3" with this command: npx skills add aaa2531349/video-transcribe

Video Transcribe - 视频转文字

🎬 一键转录本地视频/音频为文字稿

使用 OpenAI Whisper 进行本地语音识别,完全免费、离线运行、保护隐私。


✨ 功能特点

  • 完全免费 - 无需 API 密钥,无使用限制
  • 本地运行 - 视频不上传,保护隐私
  • 支持多格式 - mp4, mov, avi, mkv, mp3, wav, m4a 等
  • 自动语言检测 - 支持中文、英文等 90+ 语言
  • 带时间戳 - 输出 SRT 字幕格式
  • 多模型选择 - 从快速到高精度任选
  • AI 内容总结 - 转录后自动生成 200-300 字摘要 + 关键要点

📦 安装依赖

v1.0.3+ 无需手动安装! 首次运行时会自动检测并安装 Whisper 引擎(约 300MB,一次性)。

如果自动安装失败,可手动安装:

pip3 install openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

💡 安装大小:约 200-300 MB ⏱️ 安装时间:5-10 分钟(首次需下载模型)


🚀 使用方法

方式 1:直接用命令

# 基础用法(自动检测语言)
python transcribe.py /path/to/video.mp4

# 指定中文
python transcribe.py /path/to/video.mp4 base zh

# 转录 + AI 总结
python transcribe.py /path/to/video.mp4 --summarize

# 输出到指定目录 + 总结
python transcribe.py /path/to/video.mp4 base zh --summarize

方式 2:在 OpenClaw 中调用

/transcribe /path/to/video.mp4 --summarize

📁 输出文件

转录完成后会生成以下文件(在同一目录):

文件格式说明
视频名.txt纯文本无时间戳的文字稿
视频名.srtSRT 字幕带时间戳,可导入剪映/PR
视频名.vttWebVTT网页字幕格式
视频名_summary.jsonJSONAI 内容总结(使用 --summarize 时生成)

🔧 高级选项

# 只输出文字,不生成字幕
whisper video.mp4 --output_format txt

# 指定输出语言(翻译为英文)
whisper video.mp4 --task translate

# 调整温度(越高越随机,0 最确定)
whisper video.mp4 --temperature 0

# 显示详细日志
whisper video.mp4 --verbose True

完整选项:whisper --help


📝 注意事项

  1. 首次运行会下载模型(一次性,约 100-800 MB)
  2. 视频文件路径不要有空格,或用引号括起来
  3. 长视频需要耐心等待(5 分钟视频约 5-10 分钟转录时间)
  4. 背景噪音会影响准确率,安静环境效果更好

🙏 致谢


📮 反馈

遇到问题或有建议?欢迎反馈!

作者: Seven
版本: 1.0.3
更新时间: 2026-03-18


📋 更新日志

v1.0.3 (2026-03-18)

  • 新增:首次运行时自动安装 Whisper 依赖,无需手动执行 pip 命令
  • 🔧 优化:使用清华镜像源自动安装,国内用户更快
  • 📝 更新:SKILL.md 说明文档,告知用户自动安装行为

v1.0.2 (2026-03-16)

  • 🐛 修复:添加 YAML front matter 到 SKILL.md,修复技能在 OpenClaw 中无法显示的问题
  • 📦 更新元数据格式,确保与 ClawHub 规范兼容

v1.0.0 (2026-03-13)

  • ✨ 初始版本发布
  • 🎬 支持本地视频/音频转录
  • 🤖 集成 OpenAI Whisper 引擎
  • 📄 输出 TXT 和 SRT 格式
  • 📊 支持 AI 内容总结

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Openclaw Video Editor

Pro-Studio v4.0.0. AI-powered background removal, smart subtitle placement, and cinematic LUT presets. The ultimate production suite for high-end video content.

Registry SourceRecently Updated
4351Profile unavailable
General

ReelTalk

Helper for processing shared video links. Takes a URL, downloads the audio track, creates a text transcript, and produces a summary. Supports all major platf...

Registry SourceRecently Updated
2561Profile unavailable
General

多平台视频图文发布助手

多平台视频图文发布助手 — 支持抖音、快手、B站、小红书、微信视频号五大平台同步发布图文和视频内容。 触发场景:"一键发布到小红书、抖音、快手、B站、视频号"、"帮我同步发多个平台"、"多平台发布视频"、"发布视频到抖音"等。 ⚠️ 本 skill 需要用户协助操作浏览器登录,所有发布操作均在用户本地浏览器中完成...

Registry SourceRecently Updated
350Profile unavailable
General

YouTube/B站 视频搜索下载

多站点视频搜索、下载、字幕提取工具。支持 YouTube、B站(Bilibili)等主流平台。 结合 YouTube Data API v3 进行高级搜索,yt-dlp 下载视频/音频/字幕。 核心能力:全站关键词搜索、频道浏览、按时间/播放量/相关度排序、下载视频、提取音频(MP3)、下载字幕(中英文)、查看视...

Registry SourceRecently Updated
1670Profile unavailable