Обзор
Вы можете протестировать распознавание и синтез речи в сервисе SpeechKit на странице демо
О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.
О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.
ПЕРЕД НАЧАЛОМ РАБОТЫ.
Если не зарегистрированы в сервисе Yandex Speech в Узбекистане Cloupard, вы можете запросить тестирование для своей организации здесь.
РАСПОЗНАВАНИЕ РЕЧИ С ПОМОЩЬЮ PLAYGROUND.
Чтобы распознать речь из аудиофайла через интерфейс SpeechKit Playground.
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Распознавание речи".
3. В поле "Язык" выберите нужный язык или оставьте значение Автоматически.
4. Нажмите "Выбрать файл" или перетащите его в зону загрузки.
5. Чтобы распознать речь, нажмите "Распознать".
SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.
СИНТЕЗ РЕЧИ С ПОМОЩЬЮ PLAYGROUND.
Чтобы преобразовать текст в аудио через интерфейс SpeechKit Playground.
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Синтез речи".
3. В блоке "Настройки синтеза".
"Паузы" — выберите длительность пауз между словами или задайте ее самостоятельно.
"Акцент на слове" — расставьте акценты на нужных словах.
"Ударение" — обозначьте ударные гласные, чтобы уточнить корректный вариант произношения слов.
"Фонемы" — контролируйте правильность произношения слов с помощью фонем.
4. В блоке "Настройки синтеза".
"Язык" — выберите язык диктора.
"Голос" — укажите голос диктора.
"Амплуа" — выберите амплуа диктора.
"Скорость речи" — задайте скорость речи диктора.
"Высота голоса" — скорректируйте высоту голоса диктора.
"Формат аудио" — выберите необходимый формат аудио.
5. Чтобы синтезировать текст, нажмите "Синтезировать и воспроизвести".
6. Чтобы скачать результат, нажмите кнопку .
SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.
РАСПОЗНАВАНИЕ РЕЧИ ЧЕРЕЗ API.
Узнайте, как распознать короткие и длинные предзаписанные аудиофайлы в SpeechKit. Также сервис позволяет распознать голос в режиме реального времени.
СИНТЕЗ РЕЧИ ЧЕРЕЗ API.
Узнайте, как преобразовать текст в аудио с помощью API v1 и API v3 SpeechKit. API v3 позволяет более гибко настроить синтез. Подробнее о различиях версий API в разделе возможности синтеза.
См. также