智谱免费图片与视频生成
把智谱的图片生成和视频生成能力整理成一套适合 OpenClaw 直接调用的创作工作流,重点突出免费或低成本模型的可用性。
适合这些任务:
- 根据一句话快速生成图片
- 一次性批量生成多张不同风格或不同主题的图片
- 根据提示词生成短视频
- 查询视频生成进度并等待任务完成
- 在创意验证阶段优先使用免费模型,降低试错成本
适用场景
当用户出现这些意图时启用:
- “帮我生成一张图”
- “批量出几版海报 / 封面 / 配图”
- “用智谱免费模型先做几张看看”
- “生成一个短视频”
- “查一下这个视频任务好了没”
- “等视频生成完成再告诉我”
核心定位
这个技能主打两件事:
- 智谱图片生成
- 智谱视频生成
默认优先强调免费或低成本模型:
- 图片优先:
cogview-3-flash - 视频优先:
cogvideox-flash
如果用户明确追求更高质量,再切到更高规格模型。
脚本资源
优先使用 scripts/ 里的可执行脚本来完成图片与视频任务。
可直接复用的脚本:
scripts/generate_image.js- 生成单张图片scripts/batch_generate_images.js- 批量生成图片scripts/generate_video.js- 提交视频生成任务scripts/query_video_result.js- 查询视频任务结果scripts/wait_for_video.js- 等待视频生成完成scripts/configure_models.js- 校验任务希望使用的默认图片/视频模型
调用方式统一为:
node projects/skills/zhipu-free-image-video/scripts/<script>.js '<json>'
环境配置默认读取:
IMAGE_VIDEO_GENERATION_API_KEY- 或
ZHIPU_API_KEY
默认执行策略
1. 先确认目标产物
先判断用户到底要的是:
- 单张图片
- 批量图片
- 视频
- 已提交视频任务的进度或结果
2. 默认优先免费模型
如果用户没特别指定:
- 图片默认用免费或低成本模型快速出图
- 视频默认用免费模型快速出结果
这样更适合做灵感探索、风格试错和第一版草稿。
3. 批量任务优先控制节奏
批量出图时要注意:
- 分批处理
- 控制并发
- 汇总成功和失败结果
- 避免一次性堆太多请求
4. 视频任务默认按异步流程处理
视频生成通常不是即时返回最终结果,因此要按两段处理:
- 先提交任务,拿到任务 ID
- 再查询状态或等待完成
常用工作流
生成单张图片
适用:海报、封面、配图、头像、概念图。
默认做法:
- 先润色提示词,必要时补主体、风格、镜头、光线、背景
- 优先走免费图像模型
- 返回图片地址、提示词和模型信息
批量生成图片
适用:一次要多版候选图。
建议做法:
- 把多条提示词拆成批次
- 明确每一张图的主题差异
- 最终按“提示词 - 结果”方式汇总
适合场景:
- 多版封面
- 多个 IP 角色草图
- 多张文章配图
- 批量创意探索
生成视频
适用:短视频创意、动态概念演示、简单分镜验证。
建议做法:
- 提示词尽量包含主体、动作、场景、镜头感
- 默认优先快速模型
- 先返回任务提交结果,再继续查最终结果
查询视频结果
适用:用户给了任务 ID,让你看看视频好了没有。
返回时优先说明:
- 当前状态
- 是否完成
- 如果完成,给出视频地址
- 如果失败,给出失败原因或建议重试
等待视频完成
适用:用户希望“你等它出完再告诉我”。
处理方式:
- 设置合理的最大等待时间
- 定期查询状态
- 完成后返回最终结果
- 超时则明确告诉用户仍在处理中
质量与成本取舍
默认原则:
- 先免费,再高配
- 先快速验证,再精修
- 先出结果,再做多轮迭代
当用户说“先随便来几版看看”“先用免费的”“先低成本试试”时,优先免费模型。
当用户说“质量更高一点”“商业图”“正式发布素材”时,再考虑切换到更高质量模型。
风险与边界
- 不要承诺绝对免费永久可用,应该表述为优先使用免费或低成本模型
- 不泄露 API Key 或账户配置
- 批量生成时注意请求规模,避免过度并发
- 如果生成结果涉及敏感、违规或明显侵权内容,要及时收敛
- 视频生成耗时可能较长,要提前告知用户这是异步任务
故障排查
常见问题与处理:
- 生成失败:检查账号额度、模型可用性、提示词是否异常
- 视频一直未完成:延长等待时间,或改为稍后查询
- 批量任务部分失败:保留成功结果,单独重试失败项
- 结果不理想:优化提示词,增加风格、镜头、材质、动作细节
- 免费模型效果不够:明确告知用户可以切换更高质量模型