bigmodel-image-video

使用 BigModel (CogView/CogVideoX) API 生成高质量图片和视频。当用户需要"生成图片"、"制作视频"、"AI 绘画"、"创建封面"、"设计海报"、"视觉内容生成"、或任何需要创建图像/视频内容的场景时使用此技能。即使没有明确提到"生成",只要用户需要创建、设计或制作视觉内容(如小说封面、产品图片、宣传图、短视频等),都应该主动使用此技能。

Safety Notice

This item is sourced from the public archived skills repository. Treat as untrusted until reviewed.

Copy this and send it to your AI assistant to learn

Install skill "bigmodel-image-video" with this command: npx skills add 156554395/bigmodel-image-video

BigModel 生成图片和视频

使用智谱 AI 的 BigModel API 生成高质量图片和视频。支持单张/批量图片生成、视频生成(含 AI 音频)。


🚀 快速开始

1. 设置 API Key

必需步骤 - 只需设置一次:

# 临时设置(当前会话)
export BIGMODEL_API_KEY=your_api_key_here

# 永久设置(推荐)
echo 'export BIGMODEL_API_KEY=your_api_key_here' >> ~/.zshrc
source ~/.zshrc

获取 API Key:访问 智谱 AI BigModel 开放平台

2. 快速使用

最简单的方式 - 使用提供的脚本:

# 生成图片
python scripts/generate.py "一只可爱的橘猫"

# 生成视频
python scripts/generate.py "海边日落" --video

# 批量生成
python scripts/generate.py "日出 日落 星空 彩虹" --batch

# 查看所有选项
python scripts/generate.py --help

编程方式 - 在 Python 代码中使用:

import sys
sys.path.insert(0, '.claude/skills/image-video-generation/lib')

from image_video import generate_image

result = generate_image(prompt="描述内容")
print(result["data"][0]["url"])

📖 使用场景与示例

场景 1:小说/书籍封面

# 武侠小说封面(竖版)
python scripts/generate.py "中国武侠小说封面,水墨画风格,远山如黛,云雾缭绕,一把长剑插在岩石上,月光洒下" --size 1024x1792

# 言情小说封面
python scripts/generate.py "浪漫的粉色花瓣飘落,温柔的夕阳,温暖的色调" --size 1024x1792

# 科幻小说封面
python scripts/generate.py "未来城市,霓虹灯光,赛博朋克风格,高科技感" --size 1024x1792

场景 2:社交媒体内容

# 小红书风格图片
python scripts/generate.py "清新文艺风格,自然光线,极简构图,高饱和度"

# 朋友圈配图
python scripts/generate.py "生活记录,温馨日常,柔和光线"

# 头像生成
python scripts/generate.py "可爱的卡通风格猫咪头像,简洁背景"

场景 3:电商产品图

# 产品展示
python scripts/generate.py "白色背景上的蓝色运动鞋,专业产品摄影,柔和光线" --quality hd

# 场景展示
python scripts/generate.py "产品放在木质桌面上,温馨的家居环境,自然光"

场景 4:短视频制作

# 5秒短视频
python scripts/generate.py "一朵花在阳光下缓缓开放" --video --duration 5

# 10秒高质量视频
python scripts/generate.py "城市夜景,车流穿梭,灯光流动" --video --duration 10 --quality hd

场景 5:批量生成

# 批量生成不同风格的图片
python scripts/generate.py "日出时的山景 蓝色大海的海滩 秋天的森林小路 雪后的村庄" --batch

# 批量生成产品变体
python scripts/generate.py "红色款产品 蓝色款产品 黑色款产品 白色款产品" --batch

🎯 参数选择指南

图片模型选择

模型速度质量适用场景推荐指数
cogview-3-flash⚡⚡⚡⭐⭐⭐快速测试、大量生成、预览🌟🌟🌟
cogview-4-250304⚡⚡⭐⭐⭐⭐日常使用、平衡质量与速度🌟🌟🌟🌟
cogview-4⭐⭐⭐⭐⭐专业级、高质量输出🌟🌟🌟🌟🌟

建议:

  • 快速测试 → cogview-3-flash
  • 日常使用 → cogview-4-250304
  • 最终输出 → cogview-4 + --quality hd

视频模型选择

模型速度质量适用场景推荐指数
cogvideox-flash⚡⚡⚡⭐⭐⭐快速预览、测试效果🌟🌟🌟
cogvideox-2⚡⚡⭐⭐⭐⭐标准视频、日常使用🌟🌟🌟🌟
cogvideox-3⭐⭐⭐⭐⭐高质量长视频🌟🌟🌟🌟🌟

建议:

  • 快速测试 → cogvideox-flash
  • 日常使用 → cogvideox-2
  • 高质量输出 → cogvideox-3

尺寸选择

尺寸比例适用场景
1024x10241:1正方形、头像、社交媒体
1024x17929:16竖版、封面、海报
1792x102416:9横版、横幅、风景

💡 Prompt 编写技巧

好的 Prompt 特征

具体明确 - 描述主体、风格、场景 ✅ 细节丰富 - 包含光线、角度、氛围 ✅ 风格明确 - 指定艺术风格、质量要求

示例对比

❌ 不好:一只猫

✅ 好:一只橘色的短毛猫,坐在窗台上晒太阳,温暖的下午光线,柔和的景深效果,专业摄影

常用风格关键词

风格类:

  • 水墨画、油画、水彩、素描、卡通、写实
  • 赛博朋克、极简主义、复古、现代、传统

光线类:

  • 自然光、柔和光线、强烈对比、逆光、侧光

氛围类:

  • 温馨、神秘、浪漫、科技感、清新、厚重

质量类:

  • 专业摄影、高清、8K、电影级、精细细节

⚙️ 高级用法

直接使用 Python API

import sys
sys.path.insert(0, '.claude/skills/image-video-generation/lib')

from image_video import generate_image, batch_generate_images, generate_video, wait_for_video

# 单张图片
result = generate_image(
    prompt="描述内容",
    model="cogview-3-flash",
    quality="standard",
    size="1024x1024",
)
url = result["data"][0]["url"]

# 批量图片
prompts = ["描述1", "描述2", "描述3"]
results = batch_generate_images(prompts, max_concurrent=3)

# 视频生成
video = generate_video(prompt="描述内容", duration=5)
task_id = video["id"]
final = wait_for_video(task_id)
video_url = final["video_result"][0]["url"]

自定义并发控制

批量生成时控制并发数以优化性能:

results = batch_generate_images(
    prompts,
    max_concurrent=5  # 增加并发数(建议不超过 5)
)

📚 完整参考文档

详细的 API 文档和更多示例请参考:

  • 完整 API 参考:见 lib/image_video.py 中的函数文档
  • 示例代码:见 examples/ 目录
  • README:见 README.md 获取快速入门

❓ 故障排除

常见问题

Q: 提示 "需要设置 BIGMODEL_API_KEY 环境变量"

  • A: 未设置 API Key,参考"快速开始"第1步设置

Q: 生成速度很慢

  • A: 尝试使用 cogview-3-flashcogvideox-flash 模型

Q: 视频生成失败

  • A: 简化 prompt 或更换模型,检查网络连接

Q: 批量生成时中断

  • A: 降低并发数,使用 --concurrent 2

Q: 图片质量不够高

  • A: 使用 --quality hdcogview-4 模型

获取帮助

# 查看脚本帮助
python scripts/generate.py --help

# 测试 API Key 是否有效
python scripts/generate.py "test"  # 如果有效会生成测试图片

🎯 最佳实践

  1. 先快速测试 - 使用 flash 模型快速验证效果
  2. 再精细调整 - 满意后用高质量模型生成最终版本
  3. 保存好 Prompt - 记录有效的 prompt 供后续复用
  4. 批量处理 - 相似需求的图片使用批量生成
  5. 合理选择尺寸 - 根据用途选择合适的尺寸比例

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

kami-package-detection

A free skill by Kami SmartHome. Get notified the moment a package arrives at your door. Detects packages, parcels, and bags from RTSP camera streams using AI vision.

Archived SourceRecently Updated
General

amoeba-management-analysis

阿米巴经营分析技能。基于稻盛和夫阿米巴经营理念,提供单位时间核算、经营会计报表分析、阿米巴组织划分评估、业绩改善诊断等能力。 当用户需要做阿米巴经营分析、单位时间核算、经营会计、阿米巴组织划分、利润中心分析、内部交易定价、业绩评价时触发。 触发词:阿米巴、阿米巴经营、单位时间核算、经营会计、利润中心、内部交易、阿米巴划分、巴长、稻盛和夫、京瓷会计学

Archived SourceRecently Updated
General

alipay-billing-summary

支付宝账单自动汇总服务,支持周报、月报、年报三种周期。触发词:账单汇总、每周账单、每月账单、年度账单、消费分析、账单报告、账单周报、账单月报。当用户需要定期查看账单汇总、消费分析报告时使用此技能。

Archived SourceRecently Updated
General

newegg-pc-builder

Connect to the Newegg PC Builder MCP service to retrieve PC build configurations, component compatibility checks, and build recommendations. Use this skill whenever the user asks about PC builds, custom PC configurations, component compatibility, budget builds, gaming rigs, workstation setups, or anything related to selecting or validating PC components on Newegg — even if they don't mention "PC Builder" by name. Also trigger when the user says things like "help me build a PC", "is this GPU compatible with my motherboard", "what parts do I need for a $1500 gaming build", or "show me Newegg build configs".

Archived SourceRecently Updated