TTS Synthesizer | TTS 合成器

文字转语音(Text-to-Speech / TTS)工具。 支持 edge-tts(微软神经网络 TTS,在线合成)和 OpenAI 兼容 API TTS。 触发词:语音回复、TTS、文字转语音、语音合成、语音对话。 适用平台:Linux / Windows / macOS。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "TTS Synthesizer | TTS 合成器" with this command: npx skills add moroiser/tts-synthesizer

TTS Synthesizer | TTS 合成器 🔊

将文字转换为语音,支持微软神经网络 TTS(联网合成)和 OpenAI 兼容 API。

目录

  1. 概述
  2. 快速开始
  3. 脚本说明
  4. 声音列表
  5. 输出目录
  6. 环境变量
  7. 故障排查

概述

⚠️ 注意:OpenClaw 内置了 tts 工具,但它的输出格式(MP3/WebM)不适合直接发送飞书语音。 飞书语音消息必须用 tts_simple.py,它会自动输出 OGG/Opus 格式。

支持的 TTS 引擎

引擎说明优点缺点
edge微软神经网络 TTS免费、联网合成、高音质、支持中文需访问微软服务
apiOpenAI 兼容 API质量高、可选声音多需要 API Key

edge-tts 支持的声音(完整列表)

中文(大陆):

声音风格
zh-CN-XiaoxiaoNeural晓晓(女声,默认
zh-CN-YunxiNeural云希(男声)
zh-CN-YunyangNeural云扬(男声)
zh-CN-XiaoyiNeural晓伊(女声)

中文(台湾):

声音风格
zh-TW-HsiaoYuNeural小宇(女声)

英文:

声音风格
en-US-JennyNeural美式女声
en-US-GuyNeural美式男声
en-GB-SoniaNeural英式女声
en-GB-RyanNeural英式男声
en-AU-NatashaNeural澳式女声
en-IN-NeerjaNeural印度女声

日文:

声音风格
ja-JP-NanamiNeural日语女声
ja-JP-MayuNeural日语男声

韩文:

声音风格
ko-KR-SunHiNeural韩语女声
ko-KR-InJoonNeural韩语男声

其他常用:

声音语言
fr-FR-DeniseNeural法语女声
de-DE-KatjaNeural德语女声
es-ES-ElviraNeural西班牙语女声
ru-RU-SvetlanaNeural俄语女声
pt-BR-FranciscaNeural葡萄牙语女声

💡 查看完整列表:python3 scripts/tts_edge.py "test" --list-voices


快速开始

1. 安装依赖

cd ~/.openclaw/workspace/skills/tts-synthesizer
pip install -r requirements.txt

2. 运行(生成飞书语音用这个)

# ⭐ tts_simple.py — 输出 OGG/Opus,可直接作为飞书语音发送
python3 scripts/tts_simple.py "你好,这是测试语音"

# 使用指定声音(见下方声音列表)
python3 scripts/tts_simple.py "你好" --voice zh-CN-YunxiNeural

# 使用 API
python3 scripts/tts_simple.py "你好" --engine api \
    --api-url https://api.openai.com/v1 \
    --api-key sk-xxx \
    --voice alloy

3. 调节语速和音调

# 语速 +10%(稍快)
python3 scripts/tts_simple.py "快速播报" --rate "+10%"

# 语速 -10%(稍慢)
python3 scripts/tts_simple.py "慢速播报" --rate "-10%"

# 音调升高
python3 scripts/tts_simple.py "音调较高" --pitch "+5Hz"

脚本说明

scripts/tts_simple.py ⭐ 推荐

通用的文字转语音脚本,自动输出 OGG/Opus 格式,适合飞书语音消息

python3 scripts/tts_simple.py "要转换的文字" [选项]

参数:

参数说明
text要转换的文字,或 .txt 文件路径
--output, -o输出文件路径
--engine, -e引擎:edge(默认)或 api
--voice, -v声音名称
--rate, -r语速,如 +10%-5%(仅 edge)
--pitch, -p音调,如 +5Hz-3Hz(仅 edge)
--api-urlAPI URL(api 模式)
--api-keyAPI Key(api 模式)
--api-modelAPI 模型(默认 tts-1

scripts/tts_edge.py

纯粹的 edge-tts 脚本,输出 MP3 格式(不适合直接发送飞书语音)。

# 列出所有声音
python3 scripts/tts_edge.py "test" --list-voices

# 生成语音
python3 scripts/tts_edge.py "你好" -o output.mp3 --voice zh-CN-Xiaoxiao

💡 发送飞书语音消息请用 tts_simple.py


声音列表

edge-tts 支持 100+ 声音,可通过以下命令查看:

python3 scripts/tts_edge.py "test" --list-voices

常用声音速查:

语言代码声音
中文女声zh-CN-Xiaoxiao晓晓(默认)
中文男声zh-CN-Yunxi云希
美式女声en-US-JennyJenny
美式男声en-US-GuyGuy
英式女声en-GB-SoniaSonia
日语女声ja-JP-NanamiNanami

输出格式

重要:飞书语音消息需要 OGG/Opus 格式,必须使用 tts_simple.py

脚本输出格式适用场景
tts_simple.pyOGG/Opus飞书语音消息(直接发送)
tts_edge.pyMP3通用场景(需转换后才能发飞书语音)

tts_simple.py 会自动将 edge-tts 输出的 webm 转换为 OGG/Opus,专门适配飞书语音消息。

输出目录

运行结果保存在工作区的 projects/tts-synthesizer/ 目录下:

~/.openclaw/workspace/projects/tts-synthesizer/
└── output/
    └── tts_20260401_193000.ogg   # OGG/Opus 格式(飞书语音用这个)

环境变量

变量名说明
OPENCLAW_WORKSPACE工作区根目录
TTS_API_URLOpenAI 兼容 API URL
TTS_API_KEYAPI 密钥

故障排查

edge-tts 下载失败

# 检查网络
curl -I https://www.bing.com

# edge-tts 需要访问微软服务
# 如有代理干扰,清除环境变量
unset all_proxy ALL_PROXY

API 模式报错

  • 确认 API URL 正确(包含 /v1
  • 确认 API Key 有效
  • 检查账户余额

声音不自然

  • 中文推荐:zh-CN-Xiaoxiao(晓晓)
  • 调节语速 --rate "+10%"--rate "-10%"
  • 调节音调 --pitch "+3Hz"--pitch "-3Hz"

平台说明

edge-tts vs 其他 TTS 方案

方案成本音质中文支持离线API Key
edge-tts免费很好不需要
OpenAI TTS按量计费很高一般需要
pyttsx3免费一般不需要

已知限制

  • edge-tts 依赖微软服务,需要能访问 edge.microsoft.com
  • 部分声音在不同地区可能不可用

目录结构

技能目录(发布用)

tts-synthesizer/
├── SKILL.md                    # 本文档
├── _meta.json                  # 元数据
├── .clawhub/                   # ClawHub 源信息
├── requirements.txt            # Python 依赖
└── scripts/
    ├── tts_simple.py          # 通用 TTS 脚本(⭐ 推荐)
    └── tts_edge.py            # edge-tts 专用脚本

项目目录(运行时数据)

~/.openclaw/workspace/projects/tts-synthesizer/
├── output/                    # TTS 输出文件
└── *.ogg                     # 历史语音文件

模型说明

edge-tts 无本地模型,每次联网合成(微软服务器运行)。 如需本地 GPU TTS(用你自己的显卡),需要额外安装 Coqui XTTS 等。

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Memory Association

记忆联想系统。基于 MEMORY_INDEX.md 实现任务前的上下文联想召回,确保消耗 token 前先关联已有记忆。触发场景:(1) 启动任何新任务前 (2) 分析需求时 (3) 解决问题时 (4) 被问"之前做过什么"时 (5) Session Startup 第7步。避免重复工作,保持上下文连续性。

Registry SourceRecently Updated
General

短链接生成器

$desc

Registry SourceRecently Updated
General

AI信号筛选

从海量AI动态中筛选真正有决策价值的信号,每条必须回答"所以呢"和"该做什么

Registry SourceRecently Updated
1150ah0210
General

表情包生成器

$desc

Registry SourceRecently Updated