Wie funktioniert SSML?

Wir zeigen Ihnen, wie Sie mit SSML Ihre Stimmen anpassen können

Hier möchten wir Ihnen erklären, was Sie mit Speech Synthesis Markup Language (SSML) tun können. Mit SSML ist es möglich, die generierte Sprache anzupassen. Sie können beispielsweise Details zu Pausen und Audioformatierung für Akronyme, Datumsangaben, Uhrzeiten, Abkürzungen oder zu zensierenden Text angeben. Um dies in einem Beispiel zu demonstrieren, öffnen Sie VoiceOverMaker und den Audio-Editor:

SSML VoiceOverMaker

Das <break></break> -Element

Dort geben Sie folgenden Text ein, wie im Screenshot gezeigt:

This is a pause <break time="3s"></break> and now I'll continue.

Wie Sie hier sehen können, fügt das break-Element eine Pause von 3 Sekunden ein. Es wäre auch möglich, eine Pause mit SSML in Millisekunden, z. B. 500 ms, einzufügen. Normalerweise ist das ` 'Element wird für die Ausgabe mit SSML verwendet; Dies ist in VoiceOverMaker nicht erforderlich.

Das <say-as></say-as> -Element

Verwenden Sie dieses Element, um Informationen zum Typ der im Element enthaltenen Textkonstruktion anzugeben. Auf diese Weise können Sie auch den Detaillierungsgrad der Darstellung des im Element enthaltenen Textes bestimmen. Das <say-as></say-as> -Element verfügt über das erforderliche interpret-as-Attribut, das die Aussprache des Werts bestimmt. Abhängig vom Wert in interpret-as können Sie das optionale Attributformat und die Details verwenden.

Das folgende Beispiel wird als Ganzzahl gesprochen:

<say-as interpret-as="cardinal">12345</say-as>

Das folgende Beispiel wird als "Erste" gesprochen:

<say-as interpret-as="ordinal">1</say-as>

Das folgende Beispiel wird als "CA N" (Englisch) gesprochen:

<say-as interpret-as="characters">can</say-as>

Im folgenden Beispiel wird wie beim Zensieren ein Piepton ausgegeben:

<say-as interpret-as="expletive">censor this</say-as>

Passt die Einheiten an die Zahl an, wenn zwischen Singular oder Plural unterschieden wird. Das folgende Beispiel wird als "10 Fuß" gesprochen:

<say-as interpret-as="unit">20 foot</say-as>

Das folgende Beispiel wird Buchstabe für Buchstabe gesprochen (auf Englisch)

<say-as interpret-as="verbatim">abcdefg</say-as>

Das folgende Beispiel wird als "Der zehnte September, sechzehn sechzig" gesprochen:

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

Das folgende Beispiel wird als "10. September" bezeichnet:

<say-as format="dm" interpret-as="date">10-9</say-as>

Das folgende Beispiel wird als "Zwei Uhr dreißig" gesprochen:

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

Dies waren Beispiele dafür, wie Zahlen unterschiedlich ausgesprochen werden können. Die folgenden Optionen stehen als Parameter für das Attribut 'interpret-as' zur Verfügung:

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    Das <audio></audio> -Element

    Unterstützt das Einfügen von aufgezeichneten Audiodateien und anderen Audioformaten in Verbindung mit einer synthetisierten Sprachausgabe.

    Attribut:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    Die Absatzelemente <p>,<s></s></p>

    Beispiel:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    Wenn eine Sprachunterbrechung lang genug sein soll, damit Sie sie hören können, verwenden Sie <s></s> -Tags und fügen Sie die entsprechende Pause zwischen den Sätzen ein.

    Das Alias <sub></sub> -Element

    <sub alias="World Wide Web Consortium">W3C</sub>

    Gibt an, dass der enthaltene Text durch den Text im Attributwert "Alias" ersetzt wird, wenn er ausgesprochen wird.

    Das <prosody></prosody> -Element

    Dadurch werden Tonhöhe, Sprechgeschwindigkeit und Lautstärke für den Text im Element angepasst. Die Attribute Rate , Tonhöhe und Lautstärke werden derzeit unterstützt.

    Das <emphasis></emphasis> -Element

    Dies wird verwendet, um den Text des Elements hervorzuheben oder die Betonung zu entfernen. Mit dem Element <emphasis></emphasis> ändern Sie die Sprache ähnlich wie <prosody></prosody> , ohne jedoch einzelne Sprachattribute angeben zu müssen.

    Das Level- Attribut kann folgende Werte haben:

  • strong

  • moderate

  • none

  • reduced

    Dies war ein Auszug aus den häufigsten SSML-Elementen. Probieren Sie es jetzt mit VoiceOverMaker aus.