Come funziona SSML?

Ti mostriamo come utilizzare SSML per personalizzare le tue voci

Qui vorremmo spiegare cosa puoi fare con Speech Synthesis Markup Language (SSML). Con SSML è possibile personalizzare la lingua generata. Ad esempio, è possibile specificare i dettagli sulle pause e sulla formattazione audio per acronimi, date, orari, abbreviazioni o testo da censurare. Per dimostrarlo in un esempio, apri VoiceOverMaker e l'editor audio:

SSML VoiceOverMaker

L'elemento <break></break>

Lì inserisci il seguente testo come mostrato nello screenshot:

This is a pause <break time="3s"></break> and now I'll continue.

Come puoi vedere qui, l'elemento break inserisce una pausa di 3 secondi. Sarebbe anche possibile inserire una pausa con SSML in millisecondi, ad esempio 500ms. Normalmente, il file ` L'elemento 'viene utilizzato per l'output con SSML; questo non è necessario in VoiceOverMaker.

L'elemento <say-as></say-as>

Utilizzare questo elemento per specificare le informazioni sul tipo di costruzione del testo contenuto nell'elemento. Ciò consente anche di determinare il livello di dettaglio della rappresentazione del testo contenuto nell'elemento. L' <say-as></say-as> ha l'attributo interpret-as richiesto, che determina la pronuncia del valore. A seconda del valore in interpret-as, è possibile utilizzare il formato e il dettaglio degli attributi facoltativi.

L'esempio seguente viene letto come numero intero:

<say-as interpret-as="cardinal">12345</say-as>

L'esempio seguente viene pronunciato come "Primo":

<say-as interpret-as="ordinal">1</say-as>

L'esempio seguente viene pronunciato come "CA N" (inglese):

<say-as interpret-as="characters">can</say-as>

Nell'esempio seguente, viene emesso un segnale acustico come per la censura:

<say-as interpret-as="expletive">censor this</say-as>

Adatta le unità al numero quando si distingue tra singolare o plurale. L'esempio seguente viene pronunciato come "10 piedi":

<say-as interpret-as="unit">20 foot</say-as>

L'esempio seguente è parlato lettera per lettera (in inglese)

<say-as interpret-as="verbatim">abcdefg</say-as>

L'esempio seguente viene pronunciato come "Il decimo settembre, diciannove sessanta":

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

L'esempio seguente viene pronunciato come "Il decimo di settembre":

<say-as format="dm" interpret-as="date">10-9</say-as>

L'esempio seguente viene pronunciato come "Due trenta PM":

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

Questi erano esempi di come i numeri possono essere pronunciati in modo diverso. Le seguenti opzioni sono disponibili come parametri per l'attributo "interpreta come":

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    L'elemento <audio></audio>

    Supporta l'inserimento di file audio registrati e altri formati audio insieme all'output vocale sintetizzato.

    Attributo:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    Gli elementi di paragrafo <p>,<s></s></p>

    Esempio:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    Se vuoi che un'interruzione vocale sia abbastanza lunga da poterla ascoltare, usa i <s></s> e inserisci la pausa appropriata tra le frasi.

    L'elemento <sub></sub>

    <sub alias="World Wide Web Consortium">W3C</sub>

    Specifica che il testo contenuto viene sostituito dal testo nel valore dell'attributo "alias" quando pronunciato.

    L'elemento <prosody></prosody>

    Questo regola il tono, la velocità di pronuncia e il volume del testo nell'elemento. Gli attributi rate , pitch e volume sono attualmente supportati.

    L'elemento <emphasis></emphasis>

    Viene utilizzato per enfatizzare il testo dell'elemento o per rimuovere l'enfasi. Con l'elemento <emphasis></emphasis> si cambia la lingua in modo simile a <prosody></prosody> , ma senza dover specificare attributi di lingua individuali.

    L' attributo level può avere i seguenti valori:

  • strong

  • moderate

  • none

  • reduced

    Questo era un estratto degli elementi SSML più comuni. Provalo ora con VoiceOverMaker.