Обзор
Вы можете протестировать распознавание и синтез речи в сервисе SpeechKit на странице демо
О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.
О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.
ПЕРЕД НАЧАЛОМ РАБОТЫ
Если не зарегистрированы в сервисе Yandex Speech в Узбекистане Cloupard, вы можете запросить тестирование для своей организации здесь.
РАСПОЗНАВАНИЕ РЕЧИ С ПОМОЩЬЮ PLAYGROUND
Чтобы распознать речь из аудиофайла через интерфейс SpeechKit Playground:
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Распознавание речи".
3. В поле "Язык" выберите нужный язык или оставьте значение Автоматически.
4. Нажмите "Выбрать файл" или перетащите его в зону загрузки.
5. Чтобы распознать речь, нажмите "Распознать".
SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.
СИНТЕЗ РЕЧИ С ПОМОЩЬЮ PLAYGROUND
Чтобы преобразовать текст в аудио через интерфейс SpeechKit Playground:
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" "и перейдите на вкладку "Синтез речи".
3. В блоке "Настройки синтеза".
-
Паузы — выберите длительность пауз между словами или задайте ее самостоятельно.
-
Акцент на слове — расставьте акценты на нужных словах.
-
Ударение — обозначьте ударные гласные, чтобы уточнить корректный вариант произношения слов.
-
Фонемы — контролируйте правильность произношения слов с помощью фонем.
4. В блоке "Настройки синтеза".
-
Язык — выберите язык диктора.
-
Голос — укажите голос диктора.
-
Амплуа — выберите амплуа диктора.
-
Скорость речи — задайте скорость речи диктора.
-
Высота голоса — скорректируйте высоту голоса диктора.
-
Формат аудио — выберите необходимый формат аудио.
5. Чтобы синтезировать текст, нажмите "Синтезировать и воспроизвести".
6. Чтобы скачать результат, нажмите кнопку .
SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.
РАСПОЗНАВАНИЕ РЕЧИ ЧЕРЕЗ API
Узнайте, как распознать короткие и длинные предзаписанные аудиофайлы в SpeechKit. Также сервис позволяет распознать голос в режиме реального времени.
СИНТЕЗ РЕЧИ ЧЕРЕЗ API
Узнайте, как преобразовать текст в аудио с помощью API v1 и API v3 SpeechKit. API v3 позволяет более гибко настроить синтез. Подробнее о различиях версий API в разделе возможности синтеза.
См. также