Text-to-Speech
Transformers
Vietnamese
Inference Endpoints

Vì sao các số khi đọc lại ra tiếng gì ấy không phải tiếng việt

#3
by manh9011 - opened

Cứ phải phiên âm tiếng Việt cho các số ví dụ 1 phải viết thành một mới đọc được, rất bất tiện. Các tác giả có thể cho biết tại sao không?

này là do token thôi.
nếu normalize dành cho tiếng việt thì sẽ phải cần phiên âm.
ví dụ 1 thành "một" và 2 thành "hai"

mình có tìm paper của dự án này nhưng có vẻ là không có.
mình thấy bạn tác giả có ghi là mở rộng token sang tiếng việt (extend), nhưng mình không biết bạn ấy đã mở rộng như nào.

mình có check code demo thì mình thấy bạn ấy có hàm dùng để normalize
image.png

bạn cho normalize_text == True là được
image.png

Sign up or log in to comment