Comment fonctionne SSML?

Nous vous montrons comment utiliser SSML pour personnaliser vos voix

Ici, nous aimerions vous expliquer ce que vous pouvez faire avec le langage de balisage de synthèse vocale (SSML). Avec SSML, il est possible de personnaliser la langue générée. Par exemple, vous pouvez spécifier des détails sur les pauses et le formatage audio des acronymes, des dates, des heures, des abréviations ou du texte à censurer. Pour illustrer cela dans un exemple, ouvrez VoiceOverMaker et l'éditeur audio:

VoiceOverMaker SSML

L'élément <break></break>

Là, vous entrez le texte suivant comme indiqué dans la capture d'écran:

This is a pause <break time="3s"></break> and now I'll continue.

Comme vous pouvez le voir ici, l'élément break insère une pause de 3 secondes. Il serait également possible d'insérer une pause avec SSML en millisecondes, par exemple 500ms. Normalement, le ` 'élément est utilisé pour la sortie avec SSML; cela n'est pas nécessaire dans VoiceOverMaker.

L'élément <say-as></say-as>

Utilisez cet élément pour spécifier des informations sur le type de construction de texte contenu dans l'élément. Cela vous permet également de déterminer le niveau de détail de la représentation du texte contenu dans l'élément. L' <say-as></say-as> a l'attribut interpréter comme requis, qui détermine la prononciation de la valeur. En fonction de la valeur dans interpréter comme, vous pouvez utiliser le format et le détail des attributs facultatifs.

L'exemple suivant est prononcé sous forme d'entier:

<say-as interpret-as="cardinal">12345</say-as>

L'exemple suivant est prononcé comme «Premier»:

<say-as interpret-as="ordinal">1</say-as>

L'exemple suivant est parlé en tant que «CA N» (anglais):

<say-as interpret-as="characters">can</say-as>

Dans l'exemple suivant, un bip est émis comme pour la censure:

<say-as interpret-as="expletive">censor this</say-as>

Ajuste les unités au nombre lors de la distinction entre le singulier et le pluriel. L'exemple suivant est prononcé "10 pieds":

<say-as interpret-as="unit">20 foot</say-as>

L'exemple suivant est parlé lettre par lettre (en anglais)

<say-as interpret-as="verbatim">abcdefg</say-as>

L'exemple suivant est parlé comme "Le dix septembre, dix-neuf soixante":

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

L'exemple suivant est parlé comme "Le dix septembre":

<say-as format="dm" interpret-as="date">10-9</say-as>

L'exemple suivant est exprimé sous la forme "14 h 30":

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

Ce sont des exemples de la façon dont les nombres peuvent être prononcés différemment. Les options suivantes sont disponibles en tant que paramètres pour l'attribut 'interpréter comme':

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    L'élément <audio></audio>

    Prend en charge l'insertion de fichiers audio enregistrés et d'autres formats audio en conjonction avec la sortie vocale synthétisée.

    Attribut:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    Le paragraphe <p>,<s></s></p> éléments

    Exemple:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    Si vous voulez qu'une pause vocale soit suffisamment longue pour que vous l'entendiez, utilisez les <s></s> et insérez la pause appropriée entre les phrases.

    L'élément <sub></sub>

    <sub alias="World Wide Web Consortium">W3C</sub>

    Spécifie que le texte contenu est remplacé par le texte dans la valeur d'attribut "alias" lorsqu'il est prononcé.

    L'élément <prosody></prosody>

    Cela ajuste la hauteur, la fréquence de parole et le volume du texte dans l'élément. Les attributs rate , pitch et volume sont actuellement pris en charge.

    L'élément <emphasis></emphasis>

    Ceci est utilisé pour accentuer le texte de l'élément ou supprimer l'accentuation. Avec l'élément <emphasis></emphasis> vous changez la langue de la même manière que <prosody></prosody> , mais sans avoir à spécifier des attributs de langue individuels.

    L' attribut level peut avoir les valeurs suivantes:

  • strong

  • moderate

  • none

  • reduced

    C'était un extrait des éléments SSML les plus courants. Essayez-le maintenant avec VoiceOverMaker.