SSML ทำงานอย่างไร

เราแสดงวิธีใช้ SSML เพื่อปรับแต่งเสียงของคุณ

ในที่นี้ เราอยากจะอธิบายว่าคุณสามารถทำอะไรกับภาษามาร์กอัปการสังเคราะห์เสียงพูด (SSML) ได้บ้าง ด้วย SSML คุณสามารถกำหนดภาษาที่สร้างขึ้นเองได้ ตัวอย่างเช่น คุณสามารถระบุรายละเอียดเกี่ยวกับการหยุดชั่วคราวและการจัดรูปแบบเสียงสำหรับตัวย่อ วันที่ เวลา ตัวย่อ หรือข้อความที่จะเซ็นเซอร์ เพื่อสาธิตสิ่งนี้ในตัวอย่าง ให้เปิด VoiceOverMaker และโปรแกรมแก้ไขเสียง:

SSML VoiceOverMaker

<break></break> องค์ประกอบ

คุณป้อนข้อความต่อไปนี้ตามที่แสดงในภาพหน้าจอ:

This is a pause <break time="3s"></break> and now I'll continue.

ดังที่คุณเห็นที่นี่ องค์ประกอบตัวแบ่งจะแทรกตัวแบ่ง 3 วินาที นอกจากนี้ยังสามารถแทรกการหยุดชั่วคราวด้วย SSML ในหน่วยมิลลิวินาที เช่น 500ms โดยปกติ ` ' ใช้สำหรับเอาต์พุตที่มี SSML; สิ่งนี้ไม่จำเป็นใน VoiceOverMaker

<say-as></say-as> องค์ประกอบ

ใช้องค์ประกอบนี้เพื่อระบุข้อมูลเกี่ยวกับประเภทของการสร้างข้อความที่มีอยู่ในองค์ประกอบ นอกจากนี้ยังช่วยให้คุณกำหนดระดับรายละเอียดของการแสดงข้อความที่มีอยู่ในองค์ประกอบ องค์ประกอบ <say-as></say-as> มีแอตทริบิวต์ interpret-as ที่จำเป็น ซึ่งกำหนดการออกเสียงของค่า คุณสามารถใช้รูปแบบและรายละเอียดแอตทริบิวต์ที่เป็นทางเลือกได้ ทั้งนี้ขึ้นอยู่กับค่าในการแปลความหมาย

ตัวอย่างต่อไปนี้พูดเป็นจำนวนเต็ม:

<say-as interpret-as="cardinal">12345</say-as>

ตัวอย่างต่อไปนี้จะพูดเป็น "ก่อน":

<say-as interpret-as="ordinal">1</say-as>

ตัวอย่างต่อไปนี้ใช้คำว่า "CA N" (ภาษาอังกฤษ):

<say-as interpret-as="characters">can</say-as>

ในตัวอย่างต่อไปนี้ ระบบจะส่งเสียงบี๊บสำหรับการเซ็นเซอร์:

<say-as interpret-as="expletive">censor this</say-as>

ปรับหน่วยเป็นตัวเลขเมื่อแยกความแตกต่างระหว่างเอกพจน์หรือพหูพจน์ ตัวอย่างต่อไปนี้เรียกว่า "10 ฟุต":

<say-as interpret-as="unit">20 foot</say-as>

ตัวอย่างต่อไปนี้เป็นตัวอักษรที่พูดทีละตัวอักษร (เป็นภาษาอังกฤษ)

<say-as interpret-as="verbatim">abcdefg</say-as>

ตัวอย่างต่อไปนี้เรียกว่า "The ten of September, nineteen sixty":

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

ตัวอย่างต่อไปนี้เรียกว่า "วันที่สิบของเดือนกันยายน":

<say-as format="dm" interpret-as="date">10-9</say-as>

ตัวอย่างต่อไปนี้เรียกว่า "บ่ายสามสิบโมง":

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

เหล่านี้คือตัวอย่างวิธีการออกเสียงตัวเลขแบบต่างๆ ตัวเลือกต่อไปนี้มีให้ใช้งานเป็นพารามิเตอร์สำหรับแอตทริบิวต์ 'interpret-as':

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    <audio></audio> องค์ประกอบ

    รองรับการแทรกไฟล์เสียงที่บันทึกไว้และรูปแบบเสียงอื่น ๆ ร่วมกับเอาต์พุตเสียงสังเคราะห์

    คุณลักษณะ:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    ย่อหน้า <p>,<s></s></p> องค์ประกอบ

    ตัวอย่าง:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    หากคุณต้องการให้ช่วงพักเสียงยาวพอที่จะได้ยิน ให้ใช้แท็ก <s></s> และแทรกการหยุดชั่วคราวที่เหมาะสมระหว่างประโยค

    นามแฝง <sub></sub> องค์ประกอบ

    <sub alias="World Wide Web Consortium">W3C</sub>

    ระบุว่าข้อความที่มีอยู่จะถูกแทนที่ด้วยข้อความในค่าแอตทริบิวต์ "นามแฝง" เมื่อออกเสียง

    <prosody></prosody> องค์ประกอบ

    ซึ่งจะปรับระดับเสียง อัตราการพูด และระดับเสียงของข้อความในองค์ประกอบ ขณะนี้รองรับ อัตรา แอตทริบิวต์ ระยะห่าง และ ระดับเสียง

    <emphasis></emphasis> องค์ประกอบ

    ใช้เพื่อเน้นข้อความขององค์ประกอบหรือลบการเน้น ด้วยองค์ประกอบ <emphasis></emphasis> คุณจะเปลี่ยนภาษาที่คล้ายกับ <prosody></prosody> แต่ไม่ต้องระบุแอตทริบิวต์ของภาษาแต่ละรายการ

    แอตทริบิวต์ ระดับ สามารถมีค่าต่อไปนี้:

  • strong

  • moderate

  • none

  • reduced

    นี่เป็นข้อความที่ตัดตอนมาจากองค์ประกอบ SSML ที่พบบ่อยที่สุด ลองใช้ทันทีด้วย VoiceOverMaker