nuwa-video-gen

视频生成技能,使用 MiniMax 女娲视频生成 API 创建视频(文生视频/图生视频/首尾帧/主体参考)

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "nuwa-video-gen" with this command: npx skills add superluanxu/nuwa-video-gen

Nuwa Video Gen - MiniMax 女娲视频生成

使用 MiniMax 女娲视频生成 API,支持4种生成模式:

  1. 文生视频:根据文本描述生成视频
  2. 图生视频:基于图片 + 文本描述生成视频
  3. 首尾帧:首图 + 尾图 + 文本描述生成视频
  4. 主体参考:人脸照片 + 文本描述,保持人物特征一致

前置要求

  • API Key:从 platform.minimaxi.com 获取
  • 安装依赖:pip3 install requests
  • 设置环境变量:export MINIMAX_API_KEY="your-key"

使用方法

Python 脚本(推荐)

# 文生视频
python3 {baseDir}/scripts/video_gen.py --mode text --prompt "描述文字"

# 图生视频
python3 {baseDir}/scripts/video_gen.py --mode image --prompt "描述文字" --image "图片URL"

# 首尾帧生成
python3 {baseDir}/scripts/video_gen.py --mode start_end --prompt "描述文字" --first "首图URL" --last "尾图URL"

# 主体参考(人脸一致)
python3 {baseDir}/scripts/video_gen.py --mode subject --prompt "描述文字" --subject "人脸图片URL"

参数说明

参数说明必填
--mode模式:text / image / start_end / subject
--prompt视频描述文本
--image图生视频的首帧图片URLimage模式必填
--first首尾帧模式的首帧图片URLstart_end模式必填
--last首尾帧模式的尾帧图片URLstart_end模式必填
--subject主体参考模式的人脸图片URLsubject模式必填
--duration视频时长:6 或 10(秒)否,默认6
--resolution分辨率:720P / 1080P否,默认1080P
--output输出文件名(默认 output.mp4)

模型说明

模式模型说明
text(文生视频)MiniMax-Hailuo-2.3标准文生视频
image(图生视频)MiniMax-Hailuo-2.3以图为首帧生成视频
start_end(首尾帧)MiniMax-Hailuo-02开头结尾两图生成视频
subject(主体参考)S2V-01保持人物特征一致

输出说明

  • 视频文件保存到 --output 指定路径(默认为当前目录的 output.mp4
  • Agent 负责将生成的视频文件发送给用户

注意事项

  • 视频生成是异步过程,需要轮询等待(约10-60秒)
  • 推荐轮询间隔:10秒
  • 图片 URL 需要是公开可访问的链接
  • 主体参考模式涉及人脸图片,请确保已获得图片当事人授权

API 文档

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

gitlab-mr-reviewer

当需要审核 GitLab 合并请求、检查 MR diff 风险、发布 GitLab 审查评论、执行 approve/request changes,或发送 MR 审查通知时使用。

Registry SourceRecently Updated
1490whrime
General

Voice Transcriber Toolkit

Voice-to-Text Transcription Toolkit - 语音识别转文字,支持Whisper/Vosk引擎,批量处理,字幕导出 | Speech recognition & transcription with Whisper/Vosk engines, batch processing, su...

Registry SourceRecently Updated
General

Gigo Lobster Taster

🦞 GIGO · gigo-lobster-taster: 正式试吃模式:跑完整评测,默认上传云端、生成个人结果页并进入排行榜。 Triggers: 试吃我的龙虾 / 品鉴我的龙虾 / lobster taste / lobster taster.

Registry SourceRecently Updated
General

Gigo Lobster Local

🦞 GIGO · gigo-lobster-local: 本地模式:跑完整评测,但不上云、不注册个人结果页,证书二维码回到官网首页。 Triggers: 本地试吃龙虾 / 离线试吃龙虾 / local lobster taste / offline lobster taste.

Registry SourceRecently Updated