Audio-Segmenter
功能:一键把长音频切成固定时长的片段,专为语音训练、素材整理、翻唱/Karaoke 准备、数据集制作设计。完美保持原文件夹结构 + 智能默认输出路径 + 自动处理 ffmpeg。
触发时机(Triggers)
- 用户提到“音频切片”“切成小段”“分割音频”“切片”“分段”“每段XX秒”等词,并提供音频文件路径或文件夹。
- 用户说“帮我处理这个长音频”“制作语音数据集”“Karaoke素材准备”等场景。
- 支持单个文件或整个文件夹(可递归)。
支持的音频格式
.mp3 / .wav / .m4a / .ogg / .flac / .aac / .wma 等(pydub 支持的所有常见格式)
参数说明(默认值)
- -i → 输入路径(必填,支持单个文件或文件夹)
- -d → 每段切片时长(秒),默认 60
- -o → 输出目录(不传则智能选择:单文件同目录,文件夹则在同级创建 [输入文件夹名]_sliced_audio)
- -r → 文件夹模式下是否递归子文件夹(默认否)
参数提取指南
当决定调用此技能时,请从用户上下文中提取以下参数:
<输入路径>(必填): 用户提供的音频文件路径或文件夹路径。<切片秒数>(选填): 用户指定的每段时长(秒),未提则默认 60。<输出目录>(选填): 用户指定的输出路径,未指定则使用智能默认。- 递归标志 (
-r): 用户提到“递归”“所有子文件夹”时添加。
执行步骤
-
解析路径:自动识别用户的输入是单个音频文件还是文件夹。
-
默认输出:未指定 -o 时,单文件输出到源目录附近,文件夹则在同级创建带 _sliced_audio 的新文件夹,并保留原始目录结构。
-
调用命令:使用以下兼容性命令启动脚本(优先 python3,失败则 python)。脚本会自动创建虚拟环境、检测并安装 ffmpeg。
(python3 scripts/audio_slicer.py -i "<输入路径>" [-d <切片秒数>] [-o "<输出目录>"] [-r]) || (python scripts/audio_slicer.py -i "<输入路径>" [-d <切片秒数>] [-o "<输出目录>"] [-r])