×

Как распознать длинные аудиофайлы в API v3 и v2

 
Сервис позволяет распознавать речь различными способами. В примере аудиофайл распознается с помощью асинхронного распознавания. Асинхронное распознавание доступно в API v3 и API v2. Для асинхронного распознавания действуют ограничения.
 
1. Максимальная длительность аудио — 4 часа.
2. Максимальный размер файла — 1 ГБ.
 
Для работы с API в примере используется утилита cURL.
Если вы хотите использовать Python-скрипт для работы с API, обратитесь к практическим руководствам.
 
ПЕРЕД НАЧАЛОМ РАБОТЫ.
 
1. "Создайте" бакет и "загрузите" в него аудиофайл, который вы хотите распознать.
 
2. "Создайте" сервисный аккаунт.
Асинхронно распознать аудиофайлы можно только от имени сервисного аккаунта. Не используйте для этого другие аккаунты Yandex Speech в Узбекистане.
 
3. "Назначьте" сервисному аккаунту роли storage.uploader и ai.speechkit-stt.user на каталог, в котором вы ранее создали бакет.
 
4. "Получите API-ключ" или "IAM-токен" для созданного сервисного аккаунта.
 
5. Скачайте пример аудиофайла.
 
5.1 Для API v3 — файл WAV.
5.2  Для API v2 — файл LPCM.