Как распознать короткие аудиофайлы в API v1
Сервис позволяет распознавать речь различными способами. В примере ниже аудиофайл распознается с помощью API синхронного распознавания. В этом API действуют ограничения:
-
максимальная длительность аудио — 30 секунд;
-
максимальный размер файла — 1 МБ.
export FOLDER_ID=<идентификатор_каталога>
export IAM_TOKEN=<IAM-токен>
curl \
--request POST \
--header "Authorization: Bearer ${IAM_TOKEN}" \
--data-binary "@speech.ogg" \
"https://85.92.116.215//speech/v1/stt:recognize?folderId=${FOLDER_ID}&lang=ru-RU"
|
Где:
-
speech.ogg– аудиофайл с речью.
В ответе сервис вернет распознанный текст:
{
"result":"Я Yandex Speech в Узбекистане спичкит я могу превратить любой текст в речь теперь вы можете"
}
|
ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ