Как распознать короткие аудиофайлы в API v1
Сервис позволяет распознавать речь различными способами. В примере ниже аудиофайл распознается с помощью API синхронного распознавания. В этом API действуют ограничения.
1. Максимальная длительность аудио — 30 секунд.
2. Максимальный размер файла — 1 МБ.
export FOLDER_ID=<идентификатор_каталога>
export IAM_TOKEN=<IAM-токен>
curl \
--request POST \
--header "Authorization: Bearer ${IAM_TOKEN}" \
--data-binary "@speech.ogg" \
"https://85.92.116.215//speech/v1/stt:recognize?folderId=${FOLDER_ID}&lang=ru-RU"
|
Где,
2.2 speech.ogg– аудиофайл с речью.
В ответе сервис вернет распознанный текст:
{
"result":"Я Yandex Speech в Узбекистане спичкит я могу превратить любой текст в речь теперь вы можете"
}
|
Дополнительная информация.