ccoreilly commited on
Commit
3729983
1 Parent(s): 6cfa8d7

Manté puntuació

Browse files
Files changed (2) hide show
  1. app.py +6 -4
  2. engine.py +1 -1
app.py CHANGED
@@ -89,20 +89,22 @@ description="""
89
  Amb aquesta aplicació podeu sintetitzar text a veu amb els últims models lliures pel català.
90
 
91
  1. Model multi-parlant VITS entrenat pel BSC (Projecte Aina)
92
- https://huggingface.co/projecte-aina/tts-ca-coqui-vits-multispeaker
93
 
94
  2. Model Fastspeech entrenat per Col·lectivat
95
- https://github.com/CollectivaT-dev/TTS-API
96
 
97
  3. Model VITS entrenat per Piper/Home Assistant
98
- https://github.com/rhasspy/piper
99
 
100
  Els dós últims models han estat entrenats amb la veu d'Ona de FestCAT, que va servir com a base per a les veus catalanes de Festival
101
 
102
- El primer model conté moltes veus de qualitat variable. Podeu sel·leccionar-ne una altre al desplegable. La veu d'Ona esta sel·leccionada per defecte per la comparativa.
103
 
104
  Aquesta aplicació fa servir l'últim estat de l'espeak millorat per Carme Armentano del BSC
105
  https://github.com/projecte-aina/espeak-ng
 
 
106
  """
107
  article= ""
108
 
 
89
  Amb aquesta aplicació podeu sintetitzar text a veu amb els últims models lliures pel català.
90
 
91
  1. Model multi-parlant VITS entrenat pel BSC (Projecte Aina)
92
+ https://huggingface.co/projecte-aina/tts-ca-coqui-vits-multispeaker
93
 
94
  2. Model Fastspeech entrenat per Col·lectivat
95
+ https://github.com/CollectivaT-dev/TTS-API
96
 
97
  3. Model VITS entrenat per Piper/Home Assistant
98
+ https://github.com/rhasspy/piper
99
 
100
  Els dós últims models han estat entrenats amb la veu d'Ona de FestCAT, que va servir com a base per a les veus catalanes de Festival
101
 
102
+ El primer model conté moltes veus de qualitat variable. Podeu seleccionar-ne una altre al desplegable. La veu d'Ona esta sel·leccionada per defecte per la comparativa.
103
 
104
  Aquesta aplicació fa servir l'últim estat de l'espeak millorat per Carme Armentano del BSC
105
  https://github.com/projecte-aina/espeak-ng
106
+
107
+ NOTA: El model de col·lectivat treballa amb grafemes pel que no fa servir espeak com a fonemitzador.
108
  """
109
  article= ""
110
 
engine.py CHANGED
@@ -67,7 +67,7 @@ class Piper:
67
  if noise_w is None:
68
  noise_w = self.config.noise_w
69
 
70
- phonemes_str = self.phonemizer.phonemize(text)
71
  phonemes = [_BOS] + list(phonemes_str)
72
  phoneme_ids: List[int] = []
73
 
 
67
  if noise_w is None:
68
  noise_w = self.config.noise_w
69
 
70
+ phonemes_str = self.phonemizer.phonemize(text, keep_clause_breakers=True)
71
  phonemes = [_BOS] + list(phonemes_str)
72
  phoneme_ids: List[int] = []
73