×

Обзор

 
Вы можете протестировать распознавание и синтез речи в сервисе SpeechKit на странице демо

О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.
 
ПЕРЕД НАЧАЛОМ РАБОТЫ
 
Если не зарегистрированы в сервисе Yandex Speech в Узбекистане Cloupard, вы можете запросить тестирование для своей организации здесь.
 
РАСПОЗНАВАНИЕ РЕЧИ С ПОМОЩЬЮ PLAYGROUND
 
Чтобы распознать речь из аудиофайла через интерфейс SpeechKit Playground:
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Распознавание речи".
3. В поле "Язык" выберите нужный язык или оставьте значение Автоматически.
4. Нажмите "Выбрать файл" или перетащите его в зону загрузки.
5. Чтобы распознать речь, нажмите "Распознать".
 
SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.
 
СИНТЕЗ РЕЧИ С ПОМОЩЬЮ PLAYGROUND
 
Чтобы преобразовать текст в аудио через интерфейс SpeechKit Playground:
1. Откройте консоль управления и выберите сервис "SpeechKit".
2. На панели слева нажмите "SpeechKit Playground" "и перейдите на вкладку "Синтез речи".
3. В блоке "Настройки синтеза".
 
  • Паузы — выберите длительность пауз между словами или задайте ее самостоятельно.
  • Акцент на слове — расставьте акценты на нужных словах.
  • Ударение — обозначьте ударные гласные, чтобы уточнить корректный вариант произношения слов.
  • Фонемы — контролируйте правильность произношения слов с помощью фонем.
 
4. В блоке "Настройки синтеза".
 
  • Язык — выберите язык диктора.
  • Голос — укажите голос диктора.
  • Амплуа — выберите амплуа диктора.
  • Скорость речи — задайте скорость речи диктора.
  • Высота голоса — скорректируйте высоту голоса диктора.
  • Формат аудио — выберите необходимый формат аудио.
 
5. Чтобы синтезировать текст, нажмите "Синтезировать и воспроизвести".
6. Чтобы скачать результат, нажмите кнопку .
 
SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.
 
РАСПОЗНАВАНИЕ РЕЧИ ЧЕРЕЗ API
Узнайте, как распознать короткие и длинные предзаписанные аудиофайлы в SpeechKit. Также сервис позволяет распознать голос в режиме реального времени.
 
СИНТЕЗ РЕЧИ ЧЕРЕЗ API
Узнайте, как преобразовать текст в аудио с помощью API v1 и API v3 SpeechKit. API v3 позволяет более гибко настроить синтез. Подробнее о различиях версий API в разделе возможности синтеза.
 
См. также