Yandex SpeechKit STT
Скилл для быстрого и качественного распознавания голосовых сообщений через Yandex SpeechKit.
Настройка
Переменные окружения
Создай config.json в папке скилла:
{
"id": "your-key-id",
"service_account_id": "your-service-account-id",
"folder_id": "your-folder-id",
"private_key": "-----BEGIN PRIVATE KEY-----\n..."
}
Использование
Из командной строки
python scripts/yandex_stt.py voice_message.ogg
Из кода
import sys
sys.path.insert(0, 'scripts')
from yandex_stt import speech_to_text, get_token_iam
# Получить IAM токен
iam_token = get_token_iam(folder_id, service_account_id, private_key, key_id)
# Распознать речь
result = speech_to_text("voice.ogg", folder_id, iam_token)
print(result)
Особенности
- Автоматически обрезает аудио до 28 секунд (лимит Yandex)
- IAM токен автоматически обновляется через service account
- Работает с OggOpus, WAV, MP3