Как распознать короткие аудиофайлы в API v1

Сервис позволяет распознавать речь различными способами. В примере ниже аудиофайл распознается с помощью API синхронного распознавания. В этом API действуют ограничения.

1. Максимальная длительность аудио — 30 секунд.

2. Максимальный размер файла — 1 МБ.

Отправьте запрос на распознавание речи.

export FOLDER_ID=<идентификатор_каталога>

export IAM_TOKEN=<IAM-токен>

curl \

--request POST \

--header "Authorization: Bearer ${IAM_TOKEN}" \

--data-binary "@speech.ogg" \

"https://85.92.116.215//speech/v1/stt:recognize?folderId=${FOLDER_ID}&lang=ru-RU"

Где,

1. FOLDER_ID— идентификатор каталога, полученный перед началом работы.

2. IAM_TOKEN— IAM-токен, полученный перед началом работы.

2.1 ang— язык распознавания.

2.2 speech.ogg– аудиофайл с речью.

В ответе сервис вернет распознанный текст:

{

"result":"Я Yandex Speech в Узбекистане спичкит я могу превратить любой текст в речь теперь вы можете"

}

Дополнительная информация.

1. API синхронного распознавания.