fun-asr-file

阿里云百炼 FunASR 本地音频文件识别(非流式),使用阿里云 DashScope API 进行语音转文字。针对本地音频文件优化,支持自动格式转换,适合批量文件转写场景。

Safety Notice

This listing is from the official public ClawHub registry. Review SKILL.md and referenced scripts before running.

Copy this and send it to your AI assistant to learn

Install skill "fun-asr-file" with this command: npx skills add chenggongdu/fun-asr-file

Fun-ASR-File

Fun-ASR 是通义实验室百聆团队推出的端到端语音识别大模型,是基于数千万小时真实语音数据训练而成,具备强大的上下文理解能力与行业适应性。

激活条件

触发场景说明
用户发送音频文件.wav / .mp3 / .m4a / .flac / .ogg 等格式
用户要求转录"转写音频"、"语音转文字"
音频文件处理需要提取音频中的文字内容

配置

设置环境变量:

export DASHSCOPE_API_KEY="sk-xxx"

使用方法

安装依赖

pip install dashscope
# 如需自动格式转换,请安装 FFmpeg

转写音频文件

python scripts/cli.py audio.wav
# 支持 .wav / .mp3 / .m4a / .flac / .ogg 等格式
# 会自动转换为 API 要求的格式(16kHz, 单声道, pcm_s16le)

版本:1.1.0 创建于:2026-03-16 更新:2026-04-09 - 改为非流式调用,优化本地文件处理

Source Transparency

This detail page is rendered from real SKILL.md content. Trust labels are metadata-based hints, not a safety guarantee.

Related Skills

Related by shared tags or category signals.

General

Multi Edge-TTS CN

Edge-TTS 在线语音合成 skill。基于微软 Edge TTS 引擎,生成速度快(1-2秒),支持多种音色和输出格式。同时支持飞书(OGG/Opus)和企业微信(AMR)。默认音色 xiaoxiao_lively。需联网。

Registry SourceRecently Updated
General

vedic-destiny

吠陀命盘分析中文入口。用于完整命盘研判、命主盘 Rashi chart 与九分盘 Navamsha chart 联读、既往事件回看、出生时间稳定度判断、事业主题、婚姻主题、时空盘专题,以及基于 Jagannatha Hora PDF、星盘截图或文本命盘数据的系统拆盘。当用户提到完整星盘、事业方向、婚姻问题、关系窗...

Registry SourceRecently Updated
General

One Person Company OS

Build a visual operating cockpit for an AI-native one-person company across promise, buyer, product, delivery, cash, learning, and assets. / 为 AI 一人公司建立可视化经营...

Registry SourceRecently Updated
General

健康追踪

健康追踪技能 - 追踪饮水、睡眠、步数等健康数据,JSON存储。

Registry SourceRecently Updated