Spaces:

Kr08
/

ASR

Sleeping

App Files Files Community

Kr08 commited on Aug 26, 2024

Commit

fb79caf

verified ·

1 Parent(s): 7f5deab

Update app.py -- added copy paste text functionality

Browse files

Files changed (1) hide show

app.py +19 -13

app.py CHANGED Viewed

@@ -1,15 +1,20 @@
-import streamlit as st
 import pickle
 from io import BytesIO
-from audio_processing import detect_language, process_long_audio, load_and_resample_audio
-from model_utils import load_models
 from config import SAMPLING_RATE
 # Load models at startup
 load_models()
 # Title of the app
-st.title("Audio Player with Live Transcription")
 # Sidebar for file uploader and submit button
 st.sidebar.header("Upload Audio Files")
@@ -39,14 +44,13 @@ if submit_button and uploaded_files is not None:
 # Display uploaded files and options
 if 'audio_files' in st.session_state and st.session_state.audio_files:
     for i, uploaded_file in enumerate(st.session_state.audio_files):
-        col1, col2 = st.columns([1, 3])
-        with col1:
-            st.write(f"**File name**: {uploaded_file.name}")
-            st.audio(uploaded_file, format=uploaded_file.type)
-            st.write(f"**Detected Language**: {st.session_state.detected_languages[i]}")
-        with col2:
             if st.button(f"Transcribe {uploaded_file.name}"):
                 with st.spinner("Transcribing..."):
                     transcription = process_long_audio(st.session_state.waveforms[i], SAMPLING_RATE)
@@ -54,8 +58,10 @@ if 'audio_files' in st.session_state and st.session_state.audio_files:
             if st.session_state.transcriptions.get(i):
                 st.write("**Transcription**:")
-                st.write(st.session_state.transcriptions[i])
             if st.button(f"Translate {uploaded_file.name}"):
                 with st.spinner("Translating..."):
                     with open('languages.pkl', 'rb') as f:
@@ -65,7 +71,7 @@ if 'audio_files' in st.session_state and st.session_state.audio_files:
                     translation = process_long_audio(st.session_state.waveforms[i], SAMPLING_RATE, task="translate",
                                                      language=detected_language_name)
                     st.session_state.translations[i] = translation
             if st.session_state.translations.get(i):
                 st.write("**Translation**:")
-                st.write(st.session_state.translations[i])

+import torch
 import pickle
+import streamlit as st
 from io import BytesIO
 from config import SAMPLING_RATE
+from model_utils import load_models
+from audio_processing import detect_language, process_long_audio, load_and_resample_audio
+# Clear GPU cache
+torch.cuda.empty_cache()
 # Load models at startup
 load_models()
 # Title of the app
+st.title("Audio Player with Live Transcription and Translation")
 # Sidebar for file uploader and submit button
 st.sidebar.header("Upload Audio Files")
 # Display uploaded files and options
 if 'audio_files' in st.session_state and st.session_state.audio_files:
     for i, uploaded_file in enumerate(st.session_state.audio_files):
+        st.write(f"**File name**: {uploaded_file.name}")
+        st.audio(uploaded_file, format=uploaded_file.type)
+        st.write(f"**Detected Language**: {st.session_state.detected_languages[i]}")
+        col1, col2 = st.columns(2)
+        with col1:
             if st.button(f"Transcribe {uploaded_file.name}"):
                 with st.spinner("Transcribing..."):
                     transcription = process_long_audio(st.session_state.waveforms[i], SAMPLING_RATE)
             if st.session_state.transcriptions.get(i):
                 st.write("**Transcription**:")
+                st.text_area("", st.session_state.transcriptions[i], height=200, key=f"transcription_{i}")
+                st.markdown(f'<div style="text-align: right;"><a href="data:text/plain;charset=UTF-8,{st.session_state.transcriptions[i]}" download="transcription_{uploaded_file.name}.txt">Download Transcription</a></div>', unsafe_allow_html=True)
+        with col2:
             if st.button(f"Translate {uploaded_file.name}"):
                 with st.spinner("Translating..."):
                     with open('languages.pkl', 'rb') as f:
                     translation = process_long_audio(st.session_state.waveforms[i], SAMPLING_RATE, task="translate",
                                                      language=detected_language_name)
                     st.session_state.translations[i] = translation
             if st.session_state.translations.get(i):
                 st.write("**Translation**:")
+                st.text_area("", st.session_state.translations[i], height=200, key=f"translation_{i}")
+                st.markdown(f'<div style="text-align: right;"><a href="data:text/plain;charset=UTF-8,{st.session_state.translations[i]}" download="translation_{uploaded_file.name}.txt">Download Translation</a></div>', unsafe_allow_html=True)