SSMLはどのように機能しますか?

SSMLを使用して音声をカスタマイズする方法を紹介します

ここでは、Speech Synthesis Markup Language(SSML)で何ができるかを説明します。 SSMLを使用すると、生成された言語をカスタマイズできます。たとえば、頭字語、日付、時刻、略語、または検閲するテキストの一時停止と音声フォーマットに関する詳細を指定できます。例でこれを示すには、VoiceOverMakerとオーディオエディタを開きます。

SSML VoiceOverMaker

<break></break>要素

スクリーンショットに示すように、そこに次のテキストを入力します。

This is a pause <break time="3s"></break> and now I'll continue.

ここでわかるように、break要素は3秒のブレークを挿入します。 SSMLを使用して、ミリ秒単位で一時停止を挿入することもできます(例:500ms)。通常、 ` '要素はSSMLでの出力に使用されます。これはVoiceOverMakerでは必要ありません。

<say-as></say-as>要素

この要素を使用して、要素に含まれるテキスト構成のタイプに関する情報を指定します。これにより、要素に含まれるテキストの表現の詳細レベルを決定することもできます。 <say-as></say-as>要素には、値の発音を決定する必要なinterpret-as属性があります。解釈の値に応じて、オプションの属性の形式と詳細を使用できます。

次の例は整数として話されています。

<say-as interpret-as="cardinal">12345</say-as>

次の例は「最初」として話されています。

<say-as interpret-as="ordinal">1</say-as>

次の例は「CAN」(英語)として話されています。

<say-as interpret-as="characters">can</say-as>

次の例では、打ち切りの場合と同様にビープ音が鳴ります。

<say-as interpret-as="expletive">censor this</say-as>

単数形と複数形を区別するときに、単位を数値に調整します。次の例は「10フィート」と話されています。

<say-as interpret-as="unit">20 foot</say-as>

次の例は、文字ごとに話されています(英語)

<say-as interpret-as="verbatim">abcdefg</say-as>

次の例は、「9月10日、1960年」と話されています。

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

次の例は「9月10日」と話されています。

<say-as format="dm" interpret-as="date">10-9</say-as>

次の例は「午後2時30分」と話されています。

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

これらは、数字の発音の仕方の例です。次のオプションは、属性 'interpret-as'のパラメーターとして使用できます。

  • cardinal
  • ordinal
  • characters
  • fraction
  • expletive / bleep
  • unit
  • verbatim / spell-out
  • date
  • time
  • telephone

    <audio></audio>要素

合成音声出力と組み合わせて、録音されたオーディオファイルやその他のオーディオ形式の挿入をサポートします。

属性:

  • src
  • clipBegin
  • clipEnd
  • speed
  • repeatCount
  • repeatDur
  • soundLevel

段落<p>,<s></s></p>要素

例:

<p><s>This is sentence one.</s><s>This is sentence two.</s></p>

ボイスブレイクを十分に長くして聞こえるようにする場合は、 <s></s>タグを使用して、文の間に適切な一時停止を挿入します。

エイリアス<sub></sub>要素

<sub alias="World Wide Web Consortium">W3C</sub>

含まれているテキストが、発音時に属性値「エイリアス」のテキストに置き換えられることを指定します。

<prosody></prosody>要素

これにより、要素内のテキストのピッチ、発話速度、音量が調整されます。属性ratepitchvolumeは現在サポートされています。

<emphasis></emphasis>要素

これは、要素のテキストを強調したり、強調を削除したりするために使用されます。要素<emphasis></emphasis> <prosody></prosody>と同様に言語を変更できますが、個々の言語属性を指定する必要はありません。

level属性には、次の値を指定できます。

  • strong
  • moderate
  • none
  • reduced

これは、最も一般的なSSML要素の抜粋です。 VoiceOverMakerで今すぐお試しください。