MiniMax Speech Skill

使用 MiniMax API 进行语音合成、语音克隆和音色设计。支持同步/异步文本转语音、音色克隆、音色设计、音色查询与删除。使用模型 speech-2.8-hd，输出 mp3/wav/pcm 格式音频文件。

环境配置

{
  "MINIMAX_API_KEY": "your-api-key",
  "MINIMAX_REGION": "cn" | "int"
}

MINIMAX_API_KEY: MiniMax API 密钥
MINIMAX_REGION: 区域设置，cn 为中国，int 为国际（默认 cn）

可用函数

text_to_speech(text, voice_id, output_file)

同步文本转语音

参数:

text: 要转换的文本
voice_id: 音色ID（默认: female-tianmei）
output_file: 输出文件路径

示例: text_to_speech("你好世界", "female-tianmei", "hello.mp3")

text_to_speech_async(text, voice_id)

异步文本转语音，返回任务ID

参数:

text: 要转换的文本
voice_id: 音色ID

返回: 任务ID

query_speech_task(task_id)

查询异步任务状态

参数:

task_id: 任务ID

返回: 任务状态信息

clone_voice(audio_file_path, title)

音色快速复刻

参数:

audio_file_path: 参考音频文件路径
title: 新音色名称

返回: 新音色的 voice_id

design_voice(text, style)

音色设计

参数:

text: 音色描述文本
style: 音色风格

返回: 设计生成的 voice_id

list_voices()

获取音色列表

返回: 音色列表

get_voice(voice_id)

获取单个音色信息

参数:

voice_id: 音色ID

delete_voice(voice_id)

删除音色

参数:

voice_id: 音色ID

返回: 是否成功

常用音色

音色ID	描述
female-tianmei	女声甜美
male-yunyang	男声播音
female-badu	女声巴度
male-shawn	男声 Shawn
female-shanshan	女声杉杉

使用示例

同步语音合成

python scripts/speech.py tts "欢迎使用 MiniMax 语音服务" -v female-tianmei -o output.mp3

异步语音合成

python scripts/speech.py tts-async "这是一段较长的文本" -v male-yunyang

查询任务

python scripts/speech.py query <task_id>

克隆音色

python scripts/speech.py clone reference_audio.mp3 -t "我的音色"

音色设计

python scripts/speech.py design "温柔的女性声音，适合朗读" -s gentle

删除音色

python scripts/speech.py delete <voice_id>

注意事项

同步语音合成适合短文本（< 60秒音频）
长文本建议使用异步接口
音色克隆需要清晰、无噪音的参考音频
克隆和设计的音色需要审核后才能使用

minimax-speech

Safety Notice

Copy this and send it to your AI assistant to learn

MiniMax Speech Skill

环境配置

可用函数

text_to_speech(text, voice_id, output_file)

text_to_speech_async(text, voice_id)

query_speech_task(task_id)

clone_voice(audio_file_path, title)

design_voice(text, style)

list_voices()

get_voice(voice_id)

delete_voice(voice_id)

常用音色

使用示例

同步语音合成

异步语音合成

查询任务

克隆音色

音色设计

删除音色

注意事项

Source Transparency

Related Skills

MiniMax TTS Generator

Audiomind

Edge TTS English

Elevenlabs Tts