SSML hoạt động như thế nào?

Chúng tôi hướng dẫn bạn cách sử dụng SSML để tùy chỉnh giọng nói của bạn

Ở đây chúng tôi muốn giải thích những gì bạn có thể làm với Ngôn ngữ đánh dấu tổng hợp giọng nói (SSML). Với SSML, có thể tùy chỉnh ngôn ngữ được tạo. Ví dụ: bạn có thể chỉ định chi tiết về việc tạm dừng và định dạng âm thanh cho các từ viết tắt, ngày, giờ, chữ viết tắt hoặc văn bản cần được kiểm duyệt. Để chứng minh điều này trong một ví dụ, hãy mở VoiceOverMaker và trình chỉnh sửa âm thanh:

SSML VoiceOverMaker

Phần tử <break></break>

Ở đó, bạn nhập văn bản sau như được hiển thị trong ảnh chụp màn hình:

This is a pause <break time="3s"></break> and now I'll continue.

Như bạn có thể thấy ở đây, phần tử ngắt sẽ chèn khoảng ngắt 3 giây. Cũng có thể chèn một khoảng dừng với SSML trong mili giây, ví dụ: 500ms. Thông thường, phần tử 'được sử dụng cho đầu ra với SSML; điều này không cần thiết trong VoiceOverMaker.

Phần tử <say-as></say-as>

Sử dụng phần tử này để chỉ định thông tin về kiểu xây dựng văn bản có trong phần tử. Điều này cũng cho phép bạn xác định mức độ chi tiết của phần trình bày văn bản có trong phần tử. Phần tử <say-as></say-as> có thuộc tính thông dịch là bắt buộc, thuộc tính này xác định cách phát âm của giá trị. Tùy thuộc vào giá trị trong cách diễn giải, bạn có thể sử dụng định dạng và chi tiết thuộc tính tùy chọn.

Ví dụ sau được nói dưới dạng số nguyên:

<say-as interpret-as="cardinal">12345</say-as>

Ví dụ sau được nói là "Đầu tiên":

<say-as interpret-as="ordinal">1</say-as>

Ví dụ sau được nói là "CA N" (tiếng Anh):

<say-as interpret-as="characters">can</say-as>

Trong ví dụ sau, một tiếng bíp được phát ra để kiểm duyệt:

<say-as interpret-as="expletive">censor this</say-as>

Điều chỉnh các đơn vị thành số khi phân biệt số ít hoặc số nhiều. Ví dụ sau được nói là "10 feet":

<say-as interpret-as="unit">20 foot</say-as>

Ví dụ sau được nói từng chữ cái (bằng tiếng Anh)

<say-as interpret-as="verbatim">abcdefg</say-as>

Ví dụ sau được nói là "Ngày mười tháng chín, mười chín sáu mươi":

<say-as detail="1" format="yyyymmdd" interpret-as="date"> 1960-09-10 </say-as>

Ví dụ sau được nói là "Ngày 10 tháng 9":

<say-as format="dm" interpret-as="date">10-9</say-as>

Ví dụ sau được nói là "Hai giờ ba mươi phút":

<say-as format="hms12" interpret-as="time">2:30pm</say-as>

Đây là những ví dụ về cách các số có thể được phát âm khác nhau. Các tùy chọn sau đây có sẵn dưới dạng tham số cho thuộc tính 'thông dịch như':

  • cardinal

  • ordinal

  • characters

  • fraction

  • expletive / bleep

  • unit

  • verbatim / spell-out

  • date

  • time

  • telephone

    Phần tử <audio></audio>

    Hỗ trợ chèn các tệp âm thanh đã ghi và các định dạng âm thanh khác cùng với đầu ra giọng nói tổng hợp.

    Thuộc tính:

  • src

  • clipBegin

  • clipEnd

  • speed

  • repeatCount

  • repeatDur

  • soundLevel

    Phần tử <p>,<s></s></p>

    Thí dụ:

    <p><s>This is sentence one.</s><s>This is sentence two.</s></p>

    Nếu bạn muốn ngắt giọng đủ dài để bạn có thể nghe được, hãy sử dụng <s></s> và chèn khoảng ngắt thích hợp giữa các câu.

    Phần tử bí danh <sub></sub>

    <sub alias="World Wide Web Consortium">W3C</sub>

    Chỉ định rằng văn bản chứa được thay thế bằng văn bản trong giá trị thuộc tính "bí danh" khi được phát âm.

    Phần tử <prosody></prosody>

    Điều này điều chỉnh cao độ, tốc độ nói và âm lượng cho văn bản trong phần tử. Tỷ lệ thuộc tính, cao độâm lượng hiện được hỗ trợ.

    Phần tử <emphasis></emphasis>

    Điều này được sử dụng để nhấn mạnh văn bản của phần tử hoặc loại bỏ phần nhấn mạnh. Với phần tử <emphasis></emphasis> bạn thay đổi ngôn ngữ tương tự như <prosody></prosody> , nhưng không cần chỉ định các thuộc tính ngôn ngữ riêng lẻ.

    Thuộc tính level có thể có các giá trị sau:

  • strong

  • moderate

  • none

  • reduced

    Đây là một đoạn trích của các phần tử SSML phổ biến nhất. Hãy thử ngay bây giờ với VoiceOverMaker.