Как работает SSML?

Мы покажем вам, как использовать SSML для настройки ваших голосов.

Здесь мы хотели бы объяснить, что вы можете делать с языком разметки синтеза речи (SSML). С SSML можно настроить сгенерированный язык. Например, вы можете указать сведения о паузах и форматировании звука для сокращений, дат, времени, аббревиатур или текста, подлежащего цензуре. Чтобы продемонстрировать это на примере, откройте VoiceOverMaker и аудиоредактор:

SSML VoiceOverMaker

Элемент `<break></break>`

Там вы вводите следующий текст, как показано на скриншоте:

This is a pause <break time="3s"></break> and now I'll continue.

Как вы можете видеть здесь, элемент break вставляет паузу в 3 секунды. Также можно было бы вставить паузу с SSML в миллисекундах, например 500 мс. Обычно символ ` 'элемент используется для вывода с SSML; в VoiceOverMaker это не обязательно.

Элемент `<say-as></say-as>`

Используйте этот элемент, чтобы указать информацию о типе текстовой конструкции, содержащейся в элементе. Это также позволяет вам определить уровень детализации представления текста, содержащегося в элементе. Элемент <say-as></say-as> имеет обязательный атрибут интерпретации как, который определяет произношение значения. В зависимости от значения в интерпретаторе можно использовать дополнительные атрибуты format и detail.

В следующем примере используется целое число:

<say-as interpret-as="cardinal">12345</say-as>

Следующий пример произносится как «Первый»:

<say-as interpret-as="ordinal">1</say-as>

В следующем примере используется "CA N" (английский):

<say-as interpret-as="characters">can</say-as>

В следующем примере раздается звуковой сигнал для цензуры:

<say-as interpret-as="expletive">censor this</say-as>

Регулирует единицы измерения по числу при различении единственного и множественного числа. В следующем примере используется "10 футов":

<say-as interpret-as="unit">20 foot</say-as>

В следующем примере речь идет буква за буквой (на английском языке).

<say-as interpret-as="verbatim">abcdefg</say-as>

Следующий пример произносится как «Десятое сентября девятнадцать шестьдесят»:

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

Следующий пример произносится как «Десятое сентября»:

<say-as format="dm" interpret-as="date">10-9</say-as>

Следующий пример произносится как «два тридцать вечера»:

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

Это были примеры того, как числа могут произноситься по-разному. В качестве параметров для атрибута "интерпретировать как" доступны следующие параметры:

cardinal
ordinal
characters
fraction
expletive / bleep
unit
verbatim / spell-out
date
time
telephone

Элемент <audio></audio>

Поддерживает вставку записанных аудиофайлов и других аудиоформатов вместе с синтезированным речевым выводом.

Атрибут:
src
clipBegin
clipEnd
speed
repeatCount
repeatDur
soundLevel

Элементы абзаца ,<s></s>

Пример:

<s>This is sentence one.</s><s>This is sentence two.</s>

Если вы хотите, чтобы голосовая пауза была достаточно длинной, чтобы вы ее услышали, используйте <s></s> и вставляйте соответствующую паузу между предложениями.

Элемент псевдонима 

W3C

Указывает, что содержащийся текст заменяется текстом в значении атрибута "alias" при произнесении.

Элемент <prosody></prosody>

Это регулирует высоту тона, скорость речи и громкость текста в элементе. В настоящее время поддерживаются атрибуты rate , pitch и volume.

Элемент <emphasis></emphasis>

Это используется, чтобы выделить текст элемента или убрать акцент. С помощью элемента <emphasis></emphasis> вы меняете язык, аналогично <prosody></prosody> , но без необходимости указывать отдельные языковые атрибуты.

Атрибут уровня может иметь следующие значения:
strong
moderate
none
reduced

Это был отрывок из наиболее распространенных элементов SSML. Попробуйте прямо сейчас с VoiceOverMaker.

Зарегистрируйтесь бесплатно сейчас

Как работает SSML?

Элемент `<break></break>`

Элемент `<say-as></say-as>`

Элемент `<audio></audio>`

Элементы абзаца `<p>,<s></s></p>`

Элемент псевдонима `<sub></sub>`

Элемент `<prosody></prosody>`

Элемент `<emphasis></emphasis>`

Элемент <break></break>

Элемент <say-as></say-as>

Элемент <audio></audio>

Элементы абзаца <p>,<s></s></p>

Элемент псевдонима <sub></sub>

Элемент <prosody></prosody>

Элемент <emphasis></emphasis>

Элемент `<break></break>`

Элемент `<say-as></say-as>`

Элемент `<audio></audio>`

Элементы абзаца `<p>,<s></s></p>`

Элемент псевдонима `<sub></sub>`

Элемент `<prosody></prosody>`

Элемент `<emphasis></emphasis>`