podcast-generator

双主播播客生成器 - 输入话题自动生成播客音频,支持LLM智能生成脚本、克隆音色、文字生成音色、自定义语速语调、多种音色可选

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "podcast-generator" with this command: npx skills add cowboy231/senseaudio-podcast-generator

Podcast Generator Skill

双主播播客生成器 - 将话题文本转换为播客音频


🚀 怎么用

方式一:启动 Web 页面

在 OpenClaw 聊天中说:

启动播客生成器

Agent 会自动启动 Web 服务并打开浏览器页面 http://localhost:5000,你可以在页面中可视化操作。

方式二:直接生成播客

在 OpenClaw 聊天中说:

播客生成器帮我生成以下话题:人工智能的未来发展

或发送完整文案:

播客生成器帮我生成以下文案:
[你的播客脚本内容]

Agent 会自动生成 MP3 音频并发送给你。


🎯 两种调用模式(按渠道自动选择)

⚠️ 重要提示:根据使用场景选择正确模式!

使用场景正确模式原因
本地终端(直接在电脑上用 OpenClaw)模式 AWeb 页面可直接打开浏览器
IM 渠道(飞书/Telegram/Discord等)模式 BWeb 页面无法远程访问,只能聊天生成

❌ 常见错误:在飞书里说 "生成播客",期望打开 Web 页面

  • 原因:Web 页面只运行在本地服务器,IM 用户无法访问
  • 正确做法:在 IM 里直接发送文案,使用模式 B

模式 A:Web 页面模式(仅限本地终端)

适用场景:用户在本地电脑直接使用 OpenClaw(非 IM 渠道)

触发关键词

  • "生成播客"
  • "播客"
  • "启动播客"

流程

  1. 启动 Flask Web 服务(端口 5000)
  2. 自动打开浏览器访问 http://localhost:5000
  3. 用户在 Web 页面操作

优势

  • 可视化界面,操作直观
  • 支持实时试听、参数调整
  • 可查看历史生成记录

⚠️ 限制:仅限本地访问,IM 渠道无法使用!


模式 B:聊天生成模式(IM 渠道默认)⭐

适用场景:通过飞书、Telegram、Discord 等 IM 渠道发送消息

触发关键词

  • "生成播客"(IM 渠道自动识别)
  • "直接生成播客"
  • 或用户直接提供播客文案

流程

  1. Agent 检测到 IM 渠道 → 自动使用模式 B
  2. 发送生成信息卡片,告知默认配置
  3. 用户回复播客文案(如果尚未提供)
  4. Agent 调用 API 生成音频
  5. 根据渠道发送结果

默认配置

  • 男声:male_0004_a(青树)
  • 女声:female_0001_a(之心)
  • 语速:1.0
  • 语调:男声 0,女声 2

渠道自动识别规则

Agent 应根据 inbound_meta.chat_typechannel 自动选择模式:

渠道类型选择模式判断条件
飞书(feishu)模式 Bchannel: "feishu"
Telegram模式 Bchannel: "telegram"
Discord模式 Bchannel: "discord"
Signal模式 Bchannel: "signal"
本地终端模式 A无 channel 信息或 chat_type: "terminal"

判断逻辑

# Agent 检测渠道
if inbound_meta.get("channel") in ["feishu", "telegram", "discord", "signal"]:
    # IM 渠道 → 模式 B(聊天生成)
    use_chat_mode()
else:
    # 本地终端 → 模式 A(Web 页面)
    start_web_server()

触发后的详细交互流程

模式 A(Web 页面)- 仅限本地终端

触发条件:用户在本地终端运行 OpenClaw

用户说:"生成播客"

Agent 执行

# 1. 启动 Web 服务(后台运行)
python3 app.py &

# 2. 打开浏览器
xdg-open http://localhost:5000

Agent 发送消息

🎙️ 播客生成器已启动!

🌐 Web 页面已打开:http://localhost:5000

在页面中你可以:
• 输入话题,AI 自动生成播客脚本
• 选择音色(支持克隆音色、文字生成音色)
• 调整语速、语调
• 实时试听效果

⚠️ 注意:此模式仅限本地访问,IM 渠道无法打开浏览器!


模式 B(聊天生成)- IM 渠道默认 ⭐

触发条件:用户通过飞书/Telegram/Discord 等 IM 渠道发送消息

用户说:"生成播客"(Agent 自动识别 IM 渠道)

Agent 发送配置卡片

🎙️ 聊天生成播客

⚠️ 你正在通过 IM 渠道使用,Web 页面无法远程访问。
当前使用聊天生成模式。

📋 默认配置:
• 男声:青树(male_0004_a)
• 女声:之心(female_0001_a)
• 语速:1.0 倍
• 语调:男声 0,女声 2

✏️ 请发送你想生成的播客文案或话题:

💡 提示:直接发送文案即可,例如:
"生成播客,话题是人工智能的未来发展"

用户回复文案后:

Agent 执行

python3 scripts/generate.py --topic "用户提供的文案"

Agent 发送结果

  • 飞书渠道:上传云盘 + 发送链接
  • 其他渠道(Telegram/Discord/Signal):直接发送 MP3 文件

⚠️ 飞书渠道重要说明

飞书不支持直接发送音频文件到对话窗口!

解决方案:上传到云盘,发送云盘链接给用户。

飞书云盘上传流程

步骤 1:获取 Folder Token

从飞书云盘文件夹 URL 直接复制 token 部分(URL 最后一段)。

步骤 2:上传到云盘

url = 'https://open.feishu.cn/open-apis/drive/v1/files/upload_all'
form = {
    'file_name': '播客_话题.mp3',
    'parent_type': 'explorer',
    'parent_node': folder_token,
    'size': file_size,
    'file': mp3_data
}

步骤 3:发送链接

🎙️ 播客已上传到云盘!

**链接**: https://my.feishu.cn/drive/file/{file_token}

点击链接即可播放!

其他 IM 渠道

渠道发送方式说明
飞书云盘上传 + 链接无法直接发音频
Telegram直接发送 MP3✅ 支持
Discord直接发送 MP3✅ 支持
Signal直接发送 MP3✅ 支持

Agent 会根据渠道自动选择正确的发送方式。


参数说明

参数默认值说明
--topic必填话题内容(建议 50-200 字)
--speed1.0语速(0.5-2.0)
--pitch-male0男声语调(-12~12)
--pitch-female2女声语调(-12~12)
--male-voicemale_0004_a男声音色 ID
--female-voicefemale_0001_a女声音色 ID
--output自动生成输出文件路径

可选音色

免费音色(默认)

音色 ID名称特点
male_0004_a青树沉稳大气
female_0001_a之心亲切自然

付费音色(SVIP 限免)

音色 ID名称特点
male_0028_d激昂解说充满激情
female_0035_d甜美解说活泼可爱

特色功能(SenseAudio 平台)

  • 🔊 克隆音色:上传音频样本克隆你的声音
  • 文字生成音色:用文字描述生成专属音色

项目依赖

依赖说明
Flask 服务端口 5000
FFmpeg音频合并(已安装)
SenseAudio TTS语音合成
qwen3.5-plusLLM 脚本生成

错误处理

错误原因解决方案
服务未启动Flask 未运行python3 app.py
API Key 无效SENSEAUDIO_API_KEY 错误检查 openclaw.json
云盘上传 forbiddenfolder_token 错误使用正确的云盘 URL
生成失败TTS API 错误检查积分余额

详细文档

完整 API 文档见:references/AGENT.md

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

通义晓蜜 - 智能外呼

触发阿里云晓蜜外呼机器人任务,自动批量拨打电话。适用于批量外呼、客户回访、满意度调查、简历筛查约面试等场景。可从前置工具或节点获取外呼名单。

Registry SourceRecently Updated
General

Letterboxd Watchlist

Scrape a public Letterboxd user's watchlist into a CSV/JSONL list of titles and film URLs without logging in. Use when a user asks to export, scrape, or mirror a Letterboxd watchlist, or to build watch-next queues.

Registry SourceRecently Updated
General

Seedance Video Generation

Generate AI videos using ByteDance Seedance. Use when the user wants to: (1) generate videos from text prompts, (2) generate videos from images (first frame, first+last frame, reference images), or (3) query/manage video generation tasks. Supports Seedance 1.5 Pro (with audio), 1.0 Pro, 1.0 Pro Fast, and 1.0 Lite models.

Registry SourceRecently Updated
4.2K17jackycser
General

Universal Skills Manager

The master coordinator for AI skills. Discovers skills from multiple sources (SkillsMP.com, SkillHub, and ClawHub), manages installation, and synchronization...

Registry SourceRecently Updated