Как распознать длинные аудиофайлы в API v3 и v2

Сервис позволяет распознавать речь различными способами. В примере аудиофайл распознается с помощью асинхронного распознавания. Асинхронное распознавание доступно в API v3 и API v2. Для асинхронного распознавания действуют ограничения.

1. Максимальная длительность аудио — 4 часа.

2. Максимальный размер файла — 1 ГБ.

Для работы с API в примере используется утилита cURL.

Если вы хотите использовать Python-скрипт для работы с API, обратитесь к практическим руководствам.

ПЕРЕД НАЧАЛОМ РАБОТЫ.

1. "Создайте" бакет и "загрузите" в него аудиофайл, который вы хотите распознать.

2. "Создайте" сервисный аккаунт.

	Асинхронно распознать аудиофайлы можно только от имени сервисного аккаунта. Не используйте для этого другие аккаунты Yandex Speech в Узбекистане.

3. "Назначьте" сервисному аккаунту роли storage.uploader и ai.speechkit-stt.user на каталог, в котором вы ранее создали бакет.

4. "Получите API-ключ" или "IAM-токен" для созданного сервисного аккаунта.

5. Скачайте пример аудиофайла.

5.1 Для API v3 — файл WAV.

5.2 Для API v2 — файл LPCM.