universal-video-analyzer-zh

安装前置依赖

# 1. 安装 Python 依赖
pip install requests openai-whisper torch tenacity Pillow python-dotenv

# 2. 安装 ffmpeg（必需）
# Windows: winget install Gyan.FFmpeg
# macOS: brew install ffmpeg
# Linux: sudo apt install ffmpeg

# 3. 首次运行会自动下载 Whisper 模型（约150MB），请确保网络畅通

⚠️ 数据隐私说明

本技能会将视频关键帧图片（base64编码）和语音转写文本发送到你配置的多模态模型API。请确认：

你接受将视频内容发送到所选模型服务商
敏感/私密视频请谨慎使用，或选择私有化部署的模型
分析结果仅保存在本地，不会上传到其他地方

触发条件

当用户发送视频文件（.mp4, .mov等）并希望分析内容时，自动触发此技能。

执行命令

python doubao_video_analyzer.py "{{video_path}}"

配置说明

必需配置

设置环境变量 VIDEO_ANALYZER_API_KEY 为你的多模态模型 API Key。

可选配置

环境变量	说明	默认值
`VIDEO_ANALYZER_MODEL`	使用的模型名称	`doubao-seed-2-0-pro-260215`
`VIDEO_ANALYZER_BASE_URL`	API 基础地址	`https://ark.cn-beijing.volces.com/api/v3`
`WHISPER_MODEL_DIR`	Whisper 模型本地路径	自动下载

支持的模型示例

模型提供商	MODEL 值	BASE_URL
豆包	`doubao-seed-2-0-pro-260215`	`https://ark.cn-beijing.volces.com/api/v3`
智谱 GLM-4V	`glm-4v-plus`	`https://open.bigmodel.cn/api/paas/v4`
通义千问 VL	`qwen-vl-plus`	`https://dashscope.aliyuncs.com/compatible-mode/v1`

功能特点

✅ 双轨分析：同时分析视频画面 + 语音转文字，生成完整报告 ✅ 模型无关：支持多种多模态模型，用户自由选择 ✅ 结构化输出：自动生成场景、核心信息、亮点等结构化内容 ✅ HTML可视化报告：自动生成精美排版的HTML报告，含关键帧展示、分析结果、语音文字稿 ✅ 国内可用：支持豆包、智谱、通义等国内模型，无需翻墙 ✅ 容错完善：ffmpeg错误检查、API超时保护、跨平台路径兼容

输出文件

每次分析会自动生成以下文件：

{视频名}_分析报告.md — Markdown格式报告
{视频名}_分析报告.html — HTML可视化报告（可直接用浏览器打开）
{视频名}_frames/ — 提取的关键帧图片

universal-video-analyzer-zh

Safety Notice

Copy this and send it to your AI assistant to learn

安装前置依赖

⚠️ 数据隐私说明

触发条件

执行命令

配置说明

必需配置

可选配置

支持的模型示例

功能特点

输出文件

Source Transparency

Related Skills

gitlab-mr-reviewer

Voice Transcriber Toolkit

Gigo Lobster Taster

Gigo Lobster Local