bozo-aigc

文生图与图生图 AI 图片生成工具。使用 BizyAir GPT_IMAGE_2 API 进行文本转图片和多图参考生成。当用户需要生成图片、创建配图、文生图、文本转图片、AI 绘画、图生图、参考图片生成、多图融合、设置图片尺寸比例、生成横版/竖版图片时触发此技能。即使用户只说"帮我画一张"、"生成图片"、"根据这些图片生成"也应触发。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "bozo-aigc" with this command: npx skills add bozoyan/bozo-aigc

BOZO AIGC - 文生图与图生图工具

基于 BizyAir GPT_IMAGE_2 API 的 AI 图片生成工具,支持两种模式:文生图(T2I)图生图(I2I)

功能特点

  • 文生图:将文本描述转换为高质量图片
  • 图生图:根据 1-8 张参考图片生成新图片
  • 自动保存到 pic 文件夹,按时间戳命名
  • 支持多种图片尺寸比例

前置要求

需要设置 BizyAir API 密钥环境变量:

export BIZYAIR_API_KEY='你的API密钥'

重要:API 响应时间说明

BizyAir GPT_IMAGE_2 是远程推理服务,生成图片需要较长的等待时间:

场景预计耗时
最快(简单提示词)~90 秒
一般情况2-5 分钟
最慢(复杂提示词 / 多图)5-10 分钟

脚本已内置超时保护:

  • API 请求超时:600 秒(10 分钟),覆盖最慢情况
  • 连接超时:30 秒,防止网络不通时无限等待
  • 图片下载超时:120 秒

调用脚本前应告知用户"图片生成需要几分钟,请耐心等待"。

模式一:文生图(Text-to-Image)

当用户只有文本描述、没有参考图片时使用此模式。

API 参数

参数
端点https://api.bizyair.cn/w/v1/webapp/task/openapi/create
web_app_id52416
模型BizyAir_GPT_IMAGE_2_T2I_API
提示词键4:BizyAir_GPT_IMAGE_2_T2I_API.prompt
比例键4:BizyAir_GPT_IMAGE_2_T2I_API.aspect_ratio

使用方式

调用脚本 scripts/text-to-image.sh

./scripts/text-to-image.sh "提示词内容" [比例]

示例:

  • ./scripts/text-to-image.sh "一只可爱的猫咪" — 使用默认比例 9:16
  • ./scripts/text-to-image.sh "风景画" 16:9 — 指定横版比例

模式二:图生图(Image-to-Image)

当用户提供参考图片 URL 时使用此模式,支持 1-8 张参考图片。

API 参数

根据参考图片数量自动选择 web_app_id:

图片数量web_app_idLoadImage 节点 ID
1524187
2524207, 8
3524237, 8, 9
4523437, 8, 9, 10
5524317, 8, 9, 10, 11
6524357, 8, 9, 10, 11, 12
7524377, 8, 9, 10, 11, 12, 18
8524427, 8, 9, 10, 11, 12, 18, 20
  • 模型:BizyAir_GPT_IMAGE_2_I2I_API
  • 提示词键:6:BizyAir_GPT_IMAGE_2_I2I_API.prompt
  • 比例键:6:BizyAir_GPT_IMAGE_2_I2I_API.aspect_ratio

使用方式

调用脚本 scripts/image-to-image.sh

./scripts/image-to-image.sh "提示词" "图片URL1" ["图片URL2" ...] [比例]

示例:

  • ./scripts/image-to-image.sh "将风格改为水彩画" "https://example.com/img.png"
  • ./scripts/image-to-image.sh "融合这些风格" "url1" "url2" 16:9

图片尺寸比例

支持以下比例,默认使用 9:16

比例适用场景
1:1头像/方图
2:3标准竖图
3:2标准横图
4:5Instagram 竖图
5:4Instagram 横图
3:4竖版海报
4:3横版海报
9:16手机壁纸/短视频(默认)
16:9视频封面/横屏
21:9超宽屏/电影感

输出说明

  • 图片保存到 pic 文件夹
  • 文件名格式:YYYYMMDD_HHMMSS.png(或 .jpg
  • macOS 系统自动在预览中打开图片

工作流程

  1. 根据用户请求判断使用文生图还是图生图模式
  2. 解析用户输入:提取提示词、图片URL(如有)、比例参数
  3. 告知用户图片生成需要 2-10 分钟,请耐心等待
  4. 调用对应的脚本(Bash 工具,timeout 建议 600000ms)
  5. 等待 API 返回结果并下载图片
  6. 告知用户图片保存路径

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Polymarket Politics Random Buyer

Randomly finds a live Polymarket politics market, checks trading context, and buys 1 USDC by default with explicit dry-run and live modes for AION Market.

Registry SourceRecently Updated
General

DB Schenker

德国铁路集团旗下物流巨头,专注欧洲最大陆运网络及多式联运,提供空运、海运及合同物流服务。

Registry SourceRecently Updated
General

Secretary Memory

OpenClaw 秘书式多分区记忆系统 v3.0。仿生现代秘书的笔记本分类法,支持:(1) 多分区并发搜索 + 每分区3条上下文召回,(2) 会话自动摘要,(3) 偏好自动提取 + 用户关系图谱,(4) 记忆冲突主动检测,(5) 定时 consolidation + 会话结束 hook,(6) 精细化恢复/回溯,...

Registry SourceRecently Updated
General

Hunt

Digital bounty hunter skill for finding, tracking, and managing online hackathon opportunities. Trigger when the user says "hunt", "find hackathons", "show m...

Registry SourceRecently Updated