Web Reader TTS

# Web Reader TTS - 网页内容朗读技能

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "Web Reader TTS" with this command: npx skills add phentse/web-reader-tts

Web Reader TTS - 网页内容朗读技能

将网页内容转换为语音,支持多种 TTS 引擎和 Whisper 语音识别。

🎯 触发方式

自然语言触发

直接对我说:

  • 朗读网址 https://example.com
  • 朗读这个网页 https://example.com
  • 把这篇文章读出来 https://example.com
  • 网页朗读 https://example.com

多语言支持

自动检测网页语言,选择合适的 TTS 声音:

  • 中文zh-CN-XiaoxiaoNeural(晓晓,女声)
  • 英文en-US-JennyNeural(Jenny,女声)
  • 日文ja-JP-NanamiNeural(Nanami,女声)
  • 混合语言 → 自动切换声音

功能特性

  • Playwright 网页抓取:自动提取网页正文内容
  • Edge TTS 语音合成:免费、高质量、支持多种语言和声音
  • Whisper 语音识别:免费、本地运行、默认 medium 模型
  • 多语言检测:自动检测文本语言,选择合适的声音
  • 完整流程:网页 → 文本 → 语音 → 识别

依赖安装

# Playwright
pip install playwright
python -m playwright install chromium

# Edge TTS
pip install edge-tts

# Whisper
pip install openai-whisper

# 语言检测
pip install langdetect

使用方式

1. 自然语言调用(推荐)

直接对我说:

朗读网址 https://www.dapenti.com/blog/more.asp?name=agile&id=191854

我会自动:

  1. 提取网页内容
  2. 检测语言
  3. 生成语音
  4. 识别语音

2. 命令行调用

# 完整流程
python web_reader_tts.py --url "https://example.com"

# 仅生成语音
python web_reader_tts.py --url "https://example.com" --tts-only

# 仅语音识别
python web_reader_tts.py --audio "audio.mp3" --stt-only

# 指定语言
python web_reader_tts.py --url "https://example.com" --language en

# 使用更大的 Whisper 模型
python web_reader_tts.py --url "https://example.com" --whisper-model large-v3

参数说明

TTS 参数

参数说明默认值
--voiceTTS 声音自动检测
--rate语速+0%
--volume音量+0%
--auto-language自动检测语言True

Whisper 参数

参数说明默认值
--whisper-model模型大小medium
--language语言自动检测

可用声音

中文女声

  • zh-CN-XiaoxiaoNeural - 晓晓(推荐)
  • zh-CN-XiaoyiNeural - 晓伊
  • zh-CN-XiaochenNeural - 晓辰

中文男声

  • zh-CN-YunxiNeural - 云希
  • zh-CN-YunyangNeural - 云扬
  • zh-CN-YunjianNeural - 云健

英文女声

  • en-US-JennyNeural - Jenny(推荐)
  • en-US-AriaNeural - Aria

日文女声

  • ja-JP-NanamiNeural - Nanami(推荐)

Whisper 模型对比

模型大小速度准确率推荐场景
tiny39 MB最快较低快速预览
base74 MB中等平衡选择
small244 MB中等较高日常使用
medium769 MB较慢中文推荐(默认)
large-v31.55 GB最慢最高专业场景

多语言处理

自动语言检测

脚本会自动检测文本的主要语言,并选择合适的 TTS 声音:

# 自动检测语言
language = detect_language(text)

# 选择合适的声音
voice = get_voice_for_language(language)

混合语言处理

对于混合语言的文本(如中英混合),脚本会:

  1. 检测主要语言
  2. 使用主要语言的声音朗读
  3. Whisper 会自动识别所有语言

示例

示例 1:朗读中文网页

python web_reader_tts.py --url "https://www.dapenti.com/blog/more.asp?name=agile&id=191854"

自动使用 zh-CN-XiaoxiaoNeural 声音。

示例 2:朗读英文网页

python web_reader_tts.py --url "https://example.com/english-article"

自动使用 en-US-JennyNeural 声音。

示例 3:指定声音和模型

python web_reader_tts.py --url "https://example.com" --voice "zh-CN-YunxiNeural" --whisper-model large-v3

示例 4:调整语速

python web_reader_tts.py --url "https://example.com" --rate "+20%"

输出文件

  • audio.mp3 - 生成的语音文件
  • transcript.txt - 语音识别结果

注意事项

  1. 首次运行:Whisper 会自动下载模型(medium 模型约 769 MB)
  2. 中文识别:默认使用 medium 模型,准确率较高
  3. 网络要求:Edge TTS 需要网络连接
  4. 性能:Whisper 识别速度取决于模型大小和硬件

技术栈

  • Playwright - 网页自动化
  • Edge TTS - 微软免费 TTS 服务
  • OpenAI Whisper - 开源语音识别
  • langdetect - 语言检测

版本历史

  • v2.0.0 (2026-04-14) - 🎉 重大升级:混合提取方案(Trafilatura + Readability + newspaper3k),正文准确率提升至 95%+,自动选择最佳引擎
  • v1.3.0 (2026-04-14) - 优化内容提取算法,提升完整性至 95%+
  • v1.2.0 (2026-04-13) - 修复内容截断问题,提升内容完整性至 87%+
  • v1.1.0 (2026-04-13) - 添加多语言检测、默认 medium 模型
  • v1.0.0 (2026-04-13) - 初始版本

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Gigo Lobster Resume

🦞 GIGO · gigo-lobster-resume: 续跑入口:v2 stable 当前会清理旧 checkpoint 并从头重跑;保留此 slug 作为旧 checkpoint 兼容入口。 Triggers: 继续试吃 / 恢复评测 / resume tasting / continue lobster...

Registry SourceRecently Updated
General

YiHui CONTEXT MODE

context-mode is an MCP server that saves 98% of your context window by sandboxing tool outputs. It routes large file reads, shell outputs, and web fetches th...

Registry SourceRecently Updated
General

xinyi-drink

Use when users ask about 新一好喝/新一咖啡 drinks, stores, menu, activities, Skill用户大礼包, today drink recommendations, afternoon tea, feeling sleepy, or personalized...

Registry SourceRecently Updated
General

vedic-destiny

吠陀命盘分析中文入口。用于完整命盘研判、命主盘 Rashi chart 与九分盘 Navamsha chart 联读、既往事件回看、出生时间稳定度判断、事业主题、婚姻主题、时空盘专题,以及基于 Jagannatha Hora PDF、星盘截图或文本命盘数据的系统拆盘。当用户提到完整星盘、事业方向、婚姻问题、关系窗...

Registry SourceRecently Updated