Spaces:

owiedotch
/

dac

Sleeping

owiedotch commited on Aug 25

Commit

dfdd7ad

•

1 Parent(s): 593bdeb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,29 +1,30 @@
 import gradio as gr
-import spaces
 import torch
 import torchaudio
 from encodec import EncodecModel
 from encodec.utils import convert_audio
-from encodec.compress import compress, decompress
 import io
 # Load the Encodec model
-model = EncodecModel.encodec_model_48khz()  # Use the encodec version of the model
-model.set_target_bandwidth(6.0)  # Set the desired bandwidth
 @spaces.GPU
 def encode(audio_file_path):
     try:
         # Load and pre-process the audio waveform
         wav, sr = torchaudio.load(audio_file_path)
         wav = convert_audio(wav, sr, model.sample_rate, model.channels)
-        wav = wav.unsqueeze(0)
         # Compress to ecdc file in memory
-        compressed_audio = compress(model, wav)
-        # Save compressed audio to BytesIO
-        output = io.BytesIO(compressed_audio)
         output.seek(0)
         return output
@@ -35,11 +36,8 @@ def encode(audio_file_path):
 @spaces.GPU
 def decode(compressed_audio_file):
     try:
-        # Load compressed audio
-        compressed_audio = compressed_audio_file.read()
         # Decompress audio
-        wav, sr = decompress(compressed_audio)
         # Convert the decoded audio to a numpy array for Gradio output
         decoded_audio = wav.cpu().numpy()

 import gradio as gr
 import torch
 import torchaudio
 from encodec import EncodecModel
 from encodec.utils import convert_audio
+from encodec.compress import compress_to_file, decompress_from_file
 import io
 # Load the Encodec model
+model = EncodecModel.encodec_model_48khz()
+model.set_target_bandwidth(6.0)
 @spaces.GPU
 def encode(audio_file_path):
     try:
         # Load and pre-process the audio waveform
         wav, sr = torchaudio.load(audio_file_path)
+        # Convert to mono if necessary
+        if wav.shape[0] > 1:
+            wav = torch.mean(wav, dim=0, keepdim=True)
         wav = convert_audio(wav, sr, model.sample_rate, model.channels)
         # Compress to ecdc file in memory
+        output = io.BytesIO()
+        compress_to_file(model, wav, output)
         output.seek(0)
         return output
 @spaces.GPU
 def decode(compressed_audio_file):
     try:
         # Decompress audio
+        wav, sr = decompress_from_file(compressed_audio_file)
         # Convert the decoded audio to a numpy array for Gradio output
         decoded_audio = wav.cpu().numpy()