Hoe werkt SSML?

We laten u zien hoe u SSML kunt gebruiken om uw stemmen aan te passen

Hier willen we uitleggen wat u kunt doen met Speech Synthesis Markup Language (SSML). Met SSML is het mogelijk om de gegenereerde taal aan te passen. U kunt bijvoorbeeld details specificeren over pauzes en audio-opmaak voor acroniemen, datums, tijden, afkortingen of tekst die moet worden gecensureerd. Om dit in een voorbeeld te demonstreren, opent u VoiceOverMaker en de audio-editor:

SSML VoiceOverMaker

Het <break></break> -element

Daar voer je de volgende tekst in zoals weergegeven in de screenshot:

This is a pause <break time="3s"></break> and now I'll continue.

Zoals je hier kunt zien, voegt het break-element een pauze van 3 seconden in. Het zou ook mogelijk zijn om een pauze in te voegen met SSML in milliseconden, bijvoorbeeld 500ms. Normaal gesproken is de ` 'element wordt gebruikt voor de output met SSML; dit is niet nodig in VoiceOverMaker.

Het <say-as></say-as> -element

Gebruik dit element om informatie op te geven over het type tekstconstructie in het element. Hiermee kunt u ook het detailniveau bepalen van de weergave van de tekst in het element. Het <say-as></say-as> -element heeft het vereiste interpret-as-attribuut, dat de uitspraak van de waarde bepaalt. Afhankelijk van de waarde in interpret-as, kunt u het optionele attributenformaat en detail gebruiken.

Het volgende voorbeeld wordt uitgesproken als een geheel getal:

<say-as interpret-as="cardinal">12345</say-as>

Het volgende voorbeeld wordt uitgesproken als "Eerste":

<say-as interpret-as="ordinal">1</say-as>

Het volgende voorbeeld wordt gesproken als "CA N" (Engels):

<say-as interpret-as="characters">can</say-as>

In het volgende voorbeeld klinkt er een pieptoon voor censurering:

<say-as interpret-as="expletive">censor this</say-as>

Past eenheden aan het aantal aan bij het onderscheiden van enkelvoud of meervoud. Het volgende voorbeeld wordt uitgesproken als "10 voet":

<say-as interpret-as="unit">20 foot</say-as>

Het volgende voorbeeld wordt letter voor letter gesproken (in het Engels)

<say-as interpret-as="verbatim">abcdefg</say-as>

Het volgende voorbeeld wordt gesproken als "De tiende september negentien zestig":

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

Het volgende voorbeeld wordt gesproken als "De tiende september":

<say-as format="dm" interpret-as="date">10-9</say-as>

Het volgende voorbeeld wordt uitgesproken als "Twee uur dertig":

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

Dit waren voorbeelden van hoe getallen anders kunnen worden uitgesproken. De volgende opties zijn beschikbaar als parameters voor het attribuut 'interpret-as':

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    Het <audio></audio> -element

    Ondersteunt het invoegen van opgenomen audiobestanden en andere audioformaten in combinatie met gesynthetiseerde spraakuitvoer.

    Attribuut:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    De paragraaf <p>,<s></s></p> elementen

    Voorbeeld:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    Als je wilt dat een spraakonderbreking lang genoeg is om hem te kunnen horen, gebruik dan <s></s> -tags en voeg de juiste pauze in tussen zinnen.

    Het alias <sub></sub> -element

    <sub alias="World Wide Web Consortium">W3C</sub>

    Geeft aan dat de ingesloten tekst wordt vervangen door de tekst in de kenmerkwaarde "alias" wanneer deze wordt uitgesproken.

    Het <prosody></prosody> -element

    Dit past de toonhoogte, spreeksnelheid en het volume van de tekst in het element aan. De attributen snelheid , toonhoogte en volume worden momenteel ondersteund.

    Het <emphasis></emphasis> -element

    Dit wordt gebruikt om de tekst van het element te benadrukken of om de nadruk te verwijderen. Met het element <emphasis></emphasis> verander je de taal vergelijkbaar met <prosody></prosody> , maar zonder dat je individuele taalattributen hoeft op te geven.

    Het niveau- attribuut kan de volgende waarden hebben:

  • strong

  • moderate

  • none

  • reduced

    Dit was een uittreksel van de meest voorkomende SSML-elementen. Probeer het nu uit met VoiceOverMaker.