×

Обзор

 
Вы можете протестировать распознавание и синтез речи в сервисе SpeechKit на странице демо

О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.
 
ПЕРЕД НАЧАЛОМ РАБОТЫ.
 
Если не зарегистрированы в сервисе Yandex Speech в Узбекистане Cloupard, вы можете запросить тестирование для своей организации здесь.
 
РАСПОЗНАВАНИЕ РЕЧИ С ПОМОЩЬЮ PLAYGROUND.
 
Чтобы распознать речь из аудиофайла через интерфейс SpeechKit Playground.
 
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Распознавание речи".
3. В поле "Язык" выберите нужный язык или оставьте значение Автоматически.
4. Нажмите "Выбрать файл" или перетащите его в зону загрузки.
5. Чтобы распознать речь, нажмите "Распознать".
 
SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.
 
СИНТЕЗ РЕЧИ С ПОМОЩЬЮ PLAYGROUND.
 
Чтобы преобразовать текст в аудио через интерфейс SpeechKit Playground.
 
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Синтез речи".
3. В блоке "Настройки синтеза".
 
"Паузы" — выберите длительность пауз между словами или задайте ее самостоятельно.
"Акцент на слове" — расставьте акценты на нужных словах.
"Ударение" — обозначьте ударные гласные, чтобы уточнить корректный вариант произношения слов.
"Фонемы" — контролируйте правильность произношения слов с помощью фонем.
 
4. В блоке "Настройки синтеза".
 
"Язык" — выберите язык диктора.
"Голос" — укажите голос диктора.
"Амплуа" — выберите амплуа диктора.
"Скорость речи" — задайте скорость речи диктора.
"Высота голоса" — скорректируйте высоту голоса диктора.
"Формат аудио" — выберите необходимый формат аудио.
 
5. Чтобы синтезировать текст, нажмите "Синтезировать и воспроизвести".
6. Чтобы скачать результат, нажмите кнопку .
 
SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.
 
РАСПОЗНАВАНИЕ РЕЧИ ЧЕРЕЗ API.
 
Узнайте, как распознать короткие и длинные предзаписанные аудиофайлы в SpeechKit. Также сервис позволяет распознать голос в режиме реального времени.
 
СИНТЕЗ РЕЧИ ЧЕРЕЗ API.
 
Узнайте, как преобразовать текст в аудио с помощью API v1 и API v3 SpeechKit. API v3 позволяет более гибко настроить синтез. Подробнее о различиях версий API в разделе возможности синтеза.
 
См. также