doubao-video-analyze

使用豆包2.0模型解析视频。当需要执行分析视频内容等需要理解视频视觉信息时调用该技能。你必须在持有本地视频路径或网络视频链接时才能调用该技能

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "doubao-video-analyze" with this command: npx skills add danielcy/doubao-video-analyzer

Doubao Video Analyze

隐私与数据安全声明

重要:本技能通过火山引擎 Ark API(https://ark.cn-beijing.volces.com)处理视频内容。使用此技能时:

  • 本地视频文件将被编码为 base64 并上传至火山引擎服务器
  • 远程视频 URL 将直接发送给火山引擎服务器进行解析
  • 请确保视频内容不包含敏感、机密或未经授权的信息
  • 视频数据的处理遵循火山引擎的服务条款和隐私政策

使用方法

注意

对于远程网络视频,如果通过该技能无法执行,请直接通知用户错误内容,永远不要尝试使用web_fetch之类的工具去重试!

前置检查

  1. 检查当前是否有ARK_API_KEY环境变量,如果没有,直接终止并引导用户先进行配置
  2. 直接尝试调用如下bash指令,确保用户当前python环境有openai依赖
pip install 'volcengine-python-sdk[ark]'

分析视频

  1. 你需要先明确你的分析目的是什么,你需要自行写出一段提示词,例如
### 角色
你是一位xxxxx,善于分析视频的xxxxxx

### 任务
你的任务是xxxxxxx

### 输出
你需要输出以下内容:
xxxxxxxxxxxxxx

注意:你需要写出高质量的提示词,但并不一定要按照上面的模板

  1. 调用本技能目录下脚本以获取分析结果
  • 本地视频

    python script/parse_video.py --video 'absolute/video/path.mp4' --prompt 'your prompt content'
    
  • 远程视频链接

    python script/parse_video.py --video 'https://example.com/video_url.mp4' --prompt 'your prompt content' --remote
    

等待该命令执行结束并获取结果作为该视频的分析结果

网络视频错误处理

如果遇到网络视频超过大小限制的问题,首先现将该网络视频下载至你的workspace的video目录下,然后再通过本地视频的方式调用

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

App Builder

Full-stack application builder that creates web apps, APIs, mobile apps, and more from natural language requests. Use when the user wants to build a new appl...

Registry SourceRecently Updated
General

B2b Lead Generation

B2B Lead Generation Assistant. Activated when users say 'I want to sell XXX', 'Help me find customers', 'Analyze competitors', or 'Discover opportunities'. A...

Registry SourceRecently Updated
General

Baidu Speech Synthesis

Baidu Intelligent Cloud Speech Synthesis (TTS), supporting multi-role dialogue audio generation, SSML/segment-merge dual modes, speech rate/pitch adjustment.

Registry SourceRecently Updated
1970guoxh
General

把播客变成可读文章。支持输入音频文字稿、节目链接或摘要笔记,自动提炼核心观点、精选金句,生成适配微信公众号、知乎、企业内刊等多平台的图文内容。提供深度解析、精华摘要、对话体重构、社交媒体切片四种风格,开箱即用。

播客文章生成器。将播客内容(音频文字稿、节目链接、摘要笔记)转化为结构清晰、适合发布的图文文章。 支持多种输出风格(深度解析、精华摘要、对话体重构、社交媒体切片)和多种输出格式(Markdown、微信公众号、知乎、企业内刊)。 触发词:播客文章、播客转文章、podcast to article、podcast a...

Registry SourceRecently Updated