Edge TTS 中文语音合成技能

概述

使用微软 Edge TTS 生成高质量中文语音，默认使用 XiaoxiaoNeural 语音。当用户需要语音回复时自动触发。

能力

语音合成: 将文本转换为高质量的中文语音
默认语音: zh-CN-XiaoxiaoNeural（甜美自然的中文语音）
备用方案: 当 edge-tts 不可用时，自动降级到系统自带的 System.Speech
平台支持:
- ✅ QQ 发送（<qqmedia> wav 格式）

使用方式

基本用法

当用户表达需要语音回复时（如"生成语音"、"用语音告诉我"、"用语音说"），系统会自动：

检测 edge-tts 是否可用
使用 Edge TTS + XiaoxiaoNeural 生成语音
发送 <qqmedia>输出文件.wav</qqmedia>

前置条件

Python 3.7+ 已安装（用于运行 edge-tts）
pip 可用
QQ 通道 已配置（用于发送 wav 格式语音）

配置选项

语音选择

默认: zh-CN-XiaoxiaoNeural
其他可选微软语音:
- zh-CN-YunxiNeural（沉稳）
- zh-CN-XiaoyiNeural（温柔）
- zh-CN-YunyangNeural（磁性）

语音参数

Rate: 语速（默认 0，可调整 -5 到 5）
Volume: 音量（默认 1.0，范围 0 到 1）

技术实现

命令行调用

使用 Python 的 edge_tts 模块：

python -m edge_tts --voice "zh-CN-XiaoxiaoNeural" --text "要转换的文本" --write-media "输出文件.wav"

安装 edge-tts

如果未安装，使用 pip 安装：

pip install --user edge-tts -i https://mirrors.aliyun.com/pypi/simple/

备用语音方案

如果 edge-tts 不可用，系统会自动使用系统自带的中文 TTS。

输出格式

文件格式: WAV（微软 TTS 标准格式）
采样率: 24000 Hz
声道: 单声道
位深度: 16-bit

注意事项

网络要求: edge-tts 需要访问微软服务器
文件大小: 生成的语音文件通常在 50-200 KB
自动清理: 临时文件可能由系统自动清理
备用方案: 当 edge-tts 不可用时自动降级，不影响基本功能

示例

用户: 生成语音，"你好！这是一段测试文本。"

AI: [调用 edge-tts 生成语音]
[发送 <qqmedia>C:\Users\ADMINI~1\AppData\Local\Temp\xxx.wav</qqmedia>]
[提示语音生成完成]

故障排除

edge-tts 未安装

使用 pip 安装 edge-tts：

pip install --user edge-tts -i https://mirrors.aliyun.com/pypi/simple/

edge-tts 路径问题

检查 edge-tts 是否在 PATH 中：

Get-Command edge-tts.exe -ErrorAction SilentlyContinue

语音未生成

检查网络连接
查看错误信息
确认 QQ 通道已配置
确认 ffmpeg 已安装（如需转换格式）

Chinese Voice Skill

Safety Notice

Copy this and send it to your AI assistant to learn