Spaces:

projecte-aina
/

transcripcio-fonetica-catala

Running

ccoreilly commited on Apr 30, 2023

Commit

f47653c

•

1 Parent(s): 9dd669d

use filepath

Files changed (2) hide show

app.py CHANGED Viewed

@@ -59,12 +59,25 @@ def tts(text, speaker_idx):
     wav_coll = model_collectivat.tts(text)
     wav_piper = model_piper.synthesize(text)
-    return (model_bsc.tts_config.audio["sample_rate"], wav_bsc), (22000, wav_coll), (16000, wav_piper)
     # return output
     with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
-        model_bsc.save_wav(wavs, fp)
-        return fp.name
 description="""
@@ -83,12 +96,12 @@ iface = gr.Interface(
             label="Text",
             default="L'Èlia i l'Alí a l'aula.  L'oli i l'ou.  Lulú olorava la lila.",
         ),
-        gr.Dropdown(label="Selecciona un parlant", choices=SPEAKERS, default=None)
     ],
     outputs=[
-        gr.Audio(label="BSC VITS",type="numpy"),
-        gr.Audio(label="Collectivat Fastspeech",type="numpy"),
-        gr.Audio(label="Piper VITS",type="numpy")
     ],
     title="🗣️ TTS Català Multi Parlant - VITS 🗣️",
     description=description,

     wav_coll = model_collectivat.tts(text)
     wav_piper = model_piper.synthesize(text)
+    #return (model_bsc.tts_config.audio["sample_rate"], wav_bsc), (22000, wav_coll), (16000, wav_piper)
     # return output
+    fp_bsc = ""
     with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
+        model_bsc.save_wav(wav_bsc, fp)
+        fp_bsc = fp.name
+    fp_coll = ""
+    with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
+        model_collectivat.save_wav(wav_coll, fp)
+        fp_coll = fp.name
+    fp_piper = ""
+    with tempfile.NamedTemporaryFile(suffix=".wav", delete=False) as fp:
+        fp.write(wav_piper)
+        fp_piper = fp.name
+    return fp_bsc, fp_coll, fp_piper
 description="""
             label="Text",
             default="L'Èlia i l'Alí a l'aula.  L'oli i l'ou.  Lulú olorava la lila.",
         ),
+        gr.Dropdown(label="Selecciona un parlant", choices=SPEAKERS, default="ona")
     ],
     outputs=[
+        gr.Audio(label="BSC VITS",type="filepath"),
+        gr.Audio(label="Collectivat Fastspeech",type="filepath"),
+        gr.Audio(label="Piper VITS",type="filepath")
     ],
     title="🗣️ TTS Català Multi Parlant - VITS 🗣️",
     description=description,

engine.py CHANGED Viewed

@@ -104,7 +104,7 @@ class Piper:
             },
         )[0].squeeze((0, 1))
         audio = audio_float_to_int16(audio.squeeze())
-        return audio
         # Convert to WAV
         with io.BytesIO() as wav_io:
             wav_file: wave.Wave_write = wave.open(wav_io, "wb")

             },
         )[0].squeeze((0, 1))
         audio = audio_float_to_int16(audio.squeeze())
         # Convert to WAV
         with io.BytesIO() as wav_io:
             wav_file: wave.Wave_write = wave.open(wav_io, "wb")