Как распознать длинные аудиофайлы в API v3 и v2
Сервис позволяет распознавать речь различными способами. В примере аудиофайл распознается с помощью асинхронного распознавания. Асинхронное распознавание доступно в API v3 и API v2. Для асинхронного распознавания действуют ограничения.
1. Максимальная длительность аудио — 4 часа.
2. Максимальный размер файла — 1 ГБ.
ПЕРЕД НАЧАЛОМ РАБОТЫ.
1. "Создайте" бакет и "загрузите" в него аудиофайл, который вы хотите распознать.
2. "Создайте" сервисный аккаунт.
Асинхронно распознать аудиофайлы можно только от имени сервисного аккаунта. Не используйте для этого другие аккаунты Yandex Speech в Узбекистане.
|
3. "Назначьте" сервисному аккаунту роли storage.uploader и ai.speechkit-stt.user на каталог, в котором вы ранее создали бакет.
4. "Получите API-ключ" или "IAM-токен" для созданного сервисного аккаунта.
5. Скачайте пример аудиофайла.