jiekou-multimodal

使用接口AI 执行多模态任务:文生图、图生图、文生视频、图生视频、TTS、STT。 适用于:生成图片、生成视频、文字转语音、语音识别。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "jiekou-multimodal" with this command: npx skills add ximasadila/jiekou-multimodal

接口AI 多模态执行

配置方式(三选一,按优先级)

方式1:配置文件(推荐)

创建文件 ~/.jiekou/config.json

{
  "api_key": "你的API_Key"
}

一条命令完成配置:

mkdir -p ~/.jiekou && echo '{"api_key": "你的API_Key"}' > ~/.jiekou/config.json

方式2:环境变量

export JIEKOU_API_KEY="你的API_Key"

方式3:直接传参

在请求中直接提供:请用 API Key sk_xxx 生成一张图片...


API Key 读取逻辑

1. 检查用户消息中是否包含 API Key(sk_ 开头)
2. 检查配置文件 ~/.jiekou/config.json
3. 检查环境变量 JIEKOU_API_KEY
4. 都没有 → 返回配置引导

配置引导消息(仅在未配置时显示):

您还没有配置接口AI的 API Key。

快速配置(复制运行):
mkdir -p ~/.jiekou && echo '{"api_key": "你的Key"}' > ~/.jiekou/config.json

获取 Key:https://jiekou.ai/settings/key-management

执行流程(重要!)

用户请求 → 识别任务 → 获取 Key → ⚠️ 先发提示 → 执行任务 → 返回结果

⚠️ 必须先发送进度提示

在调用 API 之前,必须先回复用户一条消息:

🎨 收到!正在为您生成图片...

任务类型:文生图
使用模型:Gemini 3.1 Flash Image
预计耗时:10-30秒
预计费用:约 $0.03 元

请稍等,生成完成后会立即发送给您 ⏳

这条消息必须在执行 API 调用之前发送! 这样用户就知道任务已经开始处理,不会以为系统卡住了。

不同任务的提示模板

文生图:

🎨 收到!正在为您生成图片...
使用模型:Gemini 3.1 Flash Image
预计耗时:10-30秒

文生视频:

🎬 收到!正在为您生成视频...
使用模型:Veo 3.1
预计耗时:1-3分钟(视频生成较慢,请耐心等待)

TTS:

🔊 收到!正在为您生成语音...
使用模型:MiniMax Speech 2.6
预计耗时:5-10秒

完成后的回复

✅ 生成完成!

[图片/视频/音频 URL]

实际消耗:$0.03 元

视频任务的轮询提示

视频生成需要轮询,每 15 秒更新一次状态:

🎬 视频生成中...
当前状态:处理中
已等待:30 秒
预计还需:1-2 分钟

API 配置

配置项
Base URLhttps://api.jiekou.ai
鉴权Authorization: Bearer <API_KEY>
获取 Keyhttps://jiekou.ai/settings/key-management

任务类型与端点

任务端点默认模型快速模型
文生图/v3/gemini-3.1-flash-image-text-to-imageGemini 3.1 FlashSeedream 5.0 Lite
图片编辑/v3/gemini-3.1-flash-image-editGemini 3.1 Flash-
文生视频/v3/async/veo-3.1-generate-text2videoVeo 3.1Hailuo 2.3
图生视频/v3/async/veo-3.1-generate-img2videoVeo 3.1Hailuo 2.3
TTS/v3/minimax-speech-2.6-turboMiniMax Speech 2.6-
任务查询/v3/async/task-result?task_id=xxx--

快速模型触发词: 用户说"快点"、"加速"、"着急"时使用快速模型


执行模板

文生图

curl -X POST "https://api.jiekou.ai/v3/gemini-3.1-flash-image-text-to-image" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"prompt": "描述", "size": "1K", "aspect_ratio": "1:1"}'

快速模式:

curl -X POST "https://api.jiekou.ai/v3/seedream-5.0-lite" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"prompt": "描述"}'

图片编辑

curl -X POST "https://api.jiekou.ai/v3/gemini-3.1-flash-image-edit" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"prompt": "编辑指令", "reference_images": ["图片URL"]}'

文生视频

curl -X POST "https://api.jiekou.ai/v3/async/veo-3.1-generate-text2video" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"prompt": "描述", "duration_seconds": 4}'

快速模式:

curl -X POST "https://api.jiekou.ai/v3/async/minimax-hailuo-2.3-t2v" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"prompt": "描述", "duration": 6}'

图生视频

curl -X POST "https://api.jiekou.ai/v3/async/veo-3.1-generate-img2video" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"prompt": "动作描述", "image": "图片URL"}'

TTS

curl -X POST "https://api.jiekou.ai/v3/minimax-speech-2.6-turbo" \
  -H "Authorization: Bearer $API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "text": "要转换的文字",
    "voice_setting": {"voice_id": "male-qn-qingse", "speed": 1.0},
    "audio_setting": {"format": "mp3"}
  }'

可用声音:

  • 男声:male-qn-qingse(青涩)、male-qn-jingying(精英)
  • 女声:female-shaonv(少女)、female-yujie(御姐)

任务结果查询

curl "https://api.jiekou.ai/v3/async/task-result?task_id=$TASK_ID" \
  -H "Authorization: Bearer $API_KEY"

状态: TASK_STATUS_QUEUEDTASK_STATUS_PROCESSINGTASK_STATUS_SUCCEED


错误处理

错误码含义处理
401Key 无效检查配置
402余额不足https://jiekou.ai/billing 充值
429请求过快等待重试

定价

https://jiekou.ai/pricing

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

说人话

去AI味写作技能:将AI生成的文案改写成真人风格,适用于小红书、抖音、微信公众号、微博。 触发词:去AI味、润色文案、生成正文、human写作。 适用场景:AI生成初稿后,执行去AI味处理,使文案读起来自然、有人味、不像机器写的。

Registry SourceRecently Updated
General

Interview Prep Coach

Prepare candidates for technical, system-design, behavioral, case-study, and leadership interviews through diagnostic intake, timeline-based prep plans, mock...

Registry SourceRecently Updated
General

Cold Call Script Generator

Generate personalized cold call openers, voicemail scripts, cold email opening lines, and full multi-touch outbound sequences for B2B sales reps, SDRs, and f...

Registry SourceRecently Updated
General

Postzee Skill

Generate AI images/videos and post to 30+ social media platforms with Postzee. Use when the user wants to create AI media, generate images or videos, optimiz...

Registry SourceRecently Updated