SSML은 어떻게 작동합니까?

SSML을 사용하여 음성을 사용자 지정하는 방법을 보여줍니다.

여기서는 SSML(Speech Synthesis Markup Language)로 무엇을 할 수 있는지 설명하고자 합니다. SSML을 사용하면 생성된 언어를 사용자 지정할 수 있습니다. 예를 들어, 검열할 두문자어, 날짜, 시간, 약어 또는 텍스트에 대한 일시 중지 및 오디오 형식에 대한 세부 정보를 지정할 수 있습니다. 예제에서 이를 시연하려면 VoiceOverMaker와 오디오 편집기를 엽니다.

SSML 보이스오버메이커

<break></break> 요소

여기에 스크린샷과 같이 다음 텍스트를 입력합니다.

This is a pause <break time="3s"></break> and now I'll continue.

여기에서 볼 수 있듯이 break 요소는 3초의 중단을 삽입합니다. 500ms와 같이 밀리초 단위로 SSML을 사용하여 일시 중지를 삽입하는 것도 가능합니다. 일반적으로 ` ' 요소는 SSML로 출력하는 데 사용됩니다. 이것은 VoiceOverMaker에서 필요하지 않습니다.

<say-as></say-as> 요소

이 요소를 사용하여 요소에 포함된 텍스트 구성 유형에 대한 정보를 지정합니다. 이를 통해 요소에 포함된 텍스트 표현의 세부 수준을 결정할 수도 있습니다. <say-as></say-as> 요소에는 값의 발음을 결정하는 필수 interpret-as 속성이 있습니다. interpret-as의 값에 따라 선택적 속성 형식 및 세부 정보를 사용할 수 있습니다.

다음 예는 정수로 사용됩니다.

<say-as interpret-as="cardinal">12345</say-as>

다음 예는 "First"로 발음됩니다.

<say-as interpret-as="ordinal">1</say-as>

다음 예는 "CA N"(영어)으로 발음됩니다.

<say-as interpret-as="characters">can</say-as>

다음 예에서 중도절단에 대한 경고음이 발생합니다.

<say-as interpret-as="expletive">censor this</say-as>

단수 또는 복수를 구별할 때 숫자에 맞게 단위를 조정합니다. 다음 예는 "10피트"로 발음됩니다.

<say-as interpret-as="unit">20 foot</say-as>

다음 예는 한 글자씩(영어로) 말한 것입니다.

<say-as interpret-as="verbatim">abcdefg</say-as>

다음 예는 "1960년 9월 10일"로 사용됩니다.

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

다음 예는 "9월 10일"로 사용됩니다.

<say-as format="dm" interpret-as="date">10-9</say-as>

다음 예는 "Two 30 PM"으로 발음됩니다.

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

이것은 숫자가 어떻게 다르게 발음될 수 있는지에 대한 예였습니다. 'interpret-as' 속성에 대한 매개변수로 다음 옵션을 사용할 수 있습니다.

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    <audio></audio> 요소

    합성된 음성 출력과 함께 녹음된 오디오 파일 및 기타 오디오 형식의 삽입을 지원합니다.

    기인하다:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    단락 <p>,<s></s></p> 요소

    예시:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    들을 수 있을 만큼 긴 음성 중단을 원하면 <s></s> 태그를 사용하고 문장 사이에 적절한 멈춤을 삽입합니다.

    별칭 <sub></sub> 요소

    <sub alias="World Wide Web Consortium">W3C</sub>

    포함된 텍스트가 발음될 때 속성 값 "alias"의 텍스트로 대체되도록 지정합니다.

    <prosody></prosody> 요소

    이것은 요소의 텍스트에 대한 피치, 말하기 속도 및 볼륨을 조정합니다. rate , pitchvolume 속성이 현재 지원됩니다.

    <emphasis></emphasis> 요소

    요소의 텍스트를 강조하거나 강조를 제거하는 데 사용됩니다. <emphasis></emphasis> 요소를 사용하여 <prosody></prosody> 와 유사한 언어를 변경하지만 개별 언어 속성을 지정할 필요가 없습니다.

    레벨 속성은 다음 값을 가질 수 있습니다.

  • strong

  • moderate

  • none

  • reduced

    이것은 가장 일반적인 SSML 요소에서 발췌한 것입니다. 지금 VoiceOverMaker로 사용해 보세요.