AI Image Generator

异步生成 AI 图片与视频的技能。

⚠️ 首次使用必读

1. 获取 API Key

访问 https://staging.kocgo.vip/index 注册并登录，然后创建你的 API Key。

2. 设置环境变量

在使用前，你必须先设置自己的 API Key：

# Linux/macOS/Git Bash (Windows)
export AI_ARTIST_TOKEN="sk-your_api_key_here"

# Windows PowerShell
$env:AI_ARTIST_TOKEN="sk-your_api_key_here"

3. 验证配置

验证配置是否正确：

python3 scripts/test_config.py

详细配置说明请查看下方"环境配置"章节。

快速开始

python3 scripts/generate_image.py "提示词"

在对话中直接返回图片

方式 1: Markdown 图片语法（推荐）

生成图片后，直接在回复中使用 Markdown 语法：

![描述](图片URL)

平台支持情况：

✅ WebChat、Discord、Telegram：完全支持
✅ 飞书：支持（需公开 URL）
❌ WhatsApp：不支持

方式 2: 下载后发送（需要 message 工具）

使用 --download 参数下载图片，然后通过 message 工具发送：

python3 scripts/generate_image.py "风景画" --download

然后在代码中读取图片并发送：

from scripts.generate_image import generate_image
import base64

result = generate_image(prompt="风景画", download=True)
if result and result["status"] == "SUCCESS":
    # 方式 A: 使用 data URI
    image_uri = result["data_uri"]  # data:image/png;base64,...
    
    # 方式 B: 读取本地文件
    with open(result["local_path"], "rb") as f:
        image_data = f.read()
        base64_data = base64.b64encode(image_data).decode()

参数说明

通用参数

参数	默认值	说明
`prompt`	必填	生成提示词（图片或视频描述）
`--model`	`SEEDREAM5_0`	生成模型，可选: `SEEDREAM5_0`、`NANO_BANANA_2`、`SEEDANCE_1_5_PRO`
`--interval`	`5`	轮询间隔(秒)

图片专属参数（SEEDREAM5_0 / NANO_BANANA_2）

参数	默认值	说明
`--quality`	`2K`	图片质量 (2K/4K)
`--size`	模型默认值	图片尺寸。SEEDREAM5_0: `2048x2048`，NANO_BANANA_2: `1:1`
`--download`	-	下载图片到本地
`--output-dir`	`workspace/images`	图片保存目录
`--markdown-output`	-	以 Markdown 格式输出图片链接

视频专属参数（SEEDANCE_1_5_PRO）

参数	默认值	说明
`--ratio`	`16:9`	画面比例，如 `16:9`、`9:16`、`1:1`
`--resolution`	`720p`	视频分辨率，如 `720p`、`1080p`
`--duration`	`10`	视频时长（秒）

支持的模型

图片模型

模型	methodType	默认尺寸	特点
`SEEDREAM5_0`	`4`	`2048x2048`	默认模型，高质量，尺寸格式: WxH
`NANO_BANANA_2`	`5`	`1:1`	轻量快速，尺寸格式: 比例 (如 1:1, 16:9)

视频模型

模型	methodType	默认比例	默认分辨率	默认时长	特点
`SEEDANCE_1_5_PRO`	`2`	`16:9`	`720p`	10s	文生视频，支持音频生成
`SORA2`	`11`	`16:9`	`720p`	4s	图生视频，支持首尾帧控制（FIRST&LAST）

使用示例

# 基础用法 - 默认模型 SEEDREAM5_0
python3 scripts/generate_image.py "一匹狼"

# 使用 NANO_BANANA_2 模型
python3 scripts/generate_image.py "生成一只狗" --model NANO_BANANA_2

# NANO_BANANA_2 指定尺寸比例
python3 scripts/generate_image.py "风景画" --model NANO_BANANA_2 --size "16:9"

# 下载图片
python3 scripts/generate_image.py "风景画" --download

# 高质量生成（SEEDREAM5_0）
python3 scripts/generate_image.py "风景画" --quality "4K" --size "4096x4096"

# 直接输出 Markdown 图片链接
python3 scripts/generate_image.py "一只可爱的猫" --markdown-output

# 生成视频 - 默认 16:9 / 720p / 10s
python3 scripts/generate_image.py "小骏马祝福大家新年快乐" --model SEEDANCE_1_5_PRO

# 生成视频 - 指定比例和分辨率
python3 scripts/generate_image.py "海边日落风景" --model SEEDANCE_1_5_PRO --ratio "9:16" --resolution "1080p"

# 生成视频 - 指定时长
python3 scripts/generate_image.py "一只猫在玩耍" --model SEEDANCE_1_5_PRO --duration 5

# SORA2 - 纯文生视频
python3 scripts/generate_image.py "一匹小马在奔跑" --model SORA2

# SORA2 - 首帧图生视频（FIRST&LAST 模式）
python3 scripts/generate_image.py "一匹小马在奔跑" --model SORA2 --first-image-url "https://example.com/horse.jpg"

# SORA2 - 指定比例、分辨率、时长
python3 scripts/generate_image.py "一匹小马在奔跑" --model SORA2 --ratio "16:9" --resolution "720p" --duration 4

# SORA2 - 不生成音频
python3 scripts/generate_image.py "风景" --model SORA2 --no-audio

程序化调用

from scripts.generate_image import generate_image, generate_video

# 图片 - 默认 SEEDREAM5_0
result = generate_image(prompt="一只可爱的猫咪")

# 图片 - NANO_BANANA_2
result = generate_image(prompt="生成一只狗", model="NANO_BANANA_2")

# 图片 - 下载到本地
result = generate_image(prompt="风景画", model="SEEDREAM5_0", download=True, output_dir="./images")

if result and result["status"] == "SUCCESS":
    print(f"图片链接: {result['url']}")
    print(f"本地路径: {result.get('local_path')}")

# 视频 - 默认参数
result = generate_video(prompt="小骏马祝福大家新年快乐")

# 视频 - 指定比例、分辨率、时长
result = generate_video(
    prompt="海边日落风景",
    model="SEEDANCE_1_5_PRO",
    ratio="9:16",
    resolution="1080p",
    duration=5
)

# SORA2 - 纯文生视频
result = generate_video(
    prompt="一匹小马在奔跑",
    model="SORA2"
)

# SORA2 - 首尾帧控制
result = generate_video(
    prompt="一匹小马在奔跑",
    model="SORA2",
    first_image_url="https://example.com/horse.jpg",
    generate_audio=True,
    scale_factor=0.5,
    ratio="16:9",
    resolution="720p",
    duration=4
)

if result and result["status"] == "SUCCESS":
    print(f"视频链接: {result['url']}")

返回字段

字段	说明
`status`	SUCCESS / FAILED / TIMEOUT
`url`	图片URL
`message`	状态描述
`local_path`	本地保存路径（需 --download）
`data_uri`	Base64 Data URI（需 --download）
`image_data`	原始图片字节（需 --download）

环境配置

必需配置 - API Key

重要：使用前必须设置你自己的 API Key！

获取 API Key

访问 https://staging.kocgo.vip/index
注册并登录账号
在控制台创建你的 API Key
复制生成的 API Key（格式：sk-xxxxxx...）

方式 1：使用 .env 文件（推荐）

复制 .env.example 为 .env：
```
cp .env.example .env
```
编辑 .env 文件，填入你的 API Key：
```
AI_ARTIST_TOKEN=sk-your_api_key_here
```

在运行脚本前加载环境变量：

# Linux/macOS/Git Bash
source .env

# 或使用 export
export $(cat .env | xargs)

方式 2：直接设置环境变量

Linux / macOS / Git Bash (Windows)

export AI_ARTIST_TOKEN="sk-your_api_key_here"

为了永久生效，将上述命令添加到 ~/.bashrc 或 ~/.zshrc 文件中。

Windows PowerShell

$env:AI_ARTIST_TOKEN="sk-your_api_key_here"

永久设置（系统级）：

[System.Environment]::SetEnvironmentVariable('AI_ARTIST_TOKEN', 'sk-your_api_key_here', 'User')

Windows CMD

set AI_ARTIST_TOKEN=sk-your_api_key_here

验证配置

运行以下命令验证 API Key 是否设置成功：

# Linux/macOS/Git Bash
echo $AI_ARTIST_TOKEN

# Windows PowerShell
echo $env:AI_ARTIST_TOKEN

# Windows CMD
echo %AI_ARTIST_TOKEN%

如果输出为空或显示默认值，说明环境变量未正确设置。

测试配置（推荐）

运行配置测试脚本，验证 API Key 是否正确设置：

python3 scripts/test_config.py

该脚本会检查：

API Key 是否已设置
是否使用了默认 Key（需要替换为你自己的）
配置是否可以正常使用

可选配置 - 飞书通知

export FEISHU_WEBHOOK_URL="https://open.feishu.cn/open-apis/bot/v2/hook/xxx"

ai-image-generator

Safety Notice

Copy this and send it to your AI assistant to learn