Обзор

Вы можете протестировать распознавание и синтез речи в сервисе SpeechKit на странице демо

О стоимости использования сервиса читайте в разделе Правила тарификации для SpeechKit.

ПЕРЕД НАЧАЛОМ РАБОТЫ.

Если не зарегистрированы в сервисе Yandex Speech в Узбекистане Cloupard, вы можете запросить тестирование для своей организации здесь.

РАСПОЗНАВАНИЕ РЕЧИ С ПОМОЩЬЮ PLAYGROUND.

Чтобы распознать речь из аудиофайла через интерфейс SpeechKit Playground.

1. Откройте консоль управления и выберите сервис "SpeechKit".

2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Распознавание речи".

3. В поле "Язык" выберите нужный язык или оставьте значение Автоматически.

4. Нажмите "Выбрать файл" или перетащите его в зону загрузки.

5. Чтобы распознать речь, нажмите "Распознать".

SpeechKit Playground предоставляет базовые возможности распознавания речи. Более гибкие настройки распознавания доступны только через API.

СИНТЕЗ РЕЧИ С ПОМОЩЬЮ PLAYGROUND.

Чтобы преобразовать текст в аудио через интерфейс SpeechKit Playground.

1. Откройте консоль управления и выберите сервис "SpeechKit".

2. На панели слева нажмите "SpeechKit Playground" и перейдите на вкладку "Синтез речи".

3. В блоке "Настройки синтеза".

"Паузы" — выберите длительность пауз между словами или задайте ее самостоятельно.

"Акцент на слове" — расставьте акценты на нужных словах.

"Ударение" — обозначьте ударные гласные, чтобы уточнить корректный вариант произношения слов.

"Фонемы" — контролируйте правильность произношения слов с помощью фонем.

4. В блоке "Настройки синтеза".

"Язык" — выберите язык диктора.

"Голос" — укажите голос диктора.

"Амплуа" — выберите амплуа диктора.

"Скорость речи" — задайте скорость речи диктора.

"Высота голоса" — скорректируйте высоту голоса диктора.

"Формат аудио" — выберите необходимый формат аудио.

5. Чтобы синтезировать текст, нажмите "Синтезировать и воспроизвести".

6. Чтобы скачать результат, нажмите кнопку

SpeechKit Playground предоставляет базовые возможности синтеза речи. Более гибкие настройки синтеза доступны только через API.

РАСПОЗНАВАНИЕ РЕЧИ ЧЕРЕЗ API.

Узнайте, как распознать короткие и длинные предзаписанные аудиофайлы в SpeechKit. Также сервис позволяет распознать голос в режиме реального времени.

СИНТЕЗ РЕЧИ ЧЕРЕЗ API.

Узнайте, как преобразовать текст в аудио с помощью API v1 и API v3 SpeechKit. API v3 позволяет более гибко настроить синтез. Подробнее о различиях версий API в разделе возможности синтеза.

См. также

1. Подробнее про распознавание речи.

2. Подробнее про синтез речи.

3. Поддерживаемые форматы аудио.

4. Все примеры интеграции SpeechKit.