Llama-3.2s-1B-Instruct-v0.1

Sleeping

App Files Files Community

bachvudinh commited on Aug 24

Commit

6715980

•

1 Parent(s): e68d5ed

add link to homebrew and blog post

Browse files

Files changed (1) hide show

app.py +6 -13

app.py CHANGED Viewed

@@ -81,26 +81,18 @@ def text_to_audio_file(text):
 @spaces.GPU
-def process_input(input_type, text_input=None, audio_file=None):
-    # if input_type == "text":
-    #     audio_file = "temp_audio.wav"
     for partial_message in process_audio(audio_file):
         yield partial_message
-    # if input_type == "text":
-    #     os.remove(audio_file)
 @spaces.GPU
-def process_transcribe_input(input_type, text_input=None, audio_file=None):
-    # if input_type == "text":
-    #     audio_file = "temp_audio.wav"
     for partial_message in process_audio(audio_file, transcript=True):
         yield partial_message
-    # if input_type == "text":
-    #     os.remove(audio_file)
 class StopOnTokens(StoppingCriteria):
     def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs) -> bool:
         # encode </s> token
@@ -167,7 +159,8 @@ examples.extend(bad_examples)
 with gr.Blocks() as iface:
     gr.Markdown("# Llama3.1-S: checkpoint Aug 19, 2024")
     gr.Markdown("Enter text to convert to audio, then submit the audio to generate text or Upload Audio")
     with gr.Row():
         input_type = gr.Radio(["text", "audio"], label="Input Type", value="audio")
         text_input = gr.Textbox(label="Text Input", visible=False)
@@ -202,12 +195,12 @@ with gr.Blocks() as iface:
     submit_button.click(
         process_input,
-        inputs=[input_type, text_input, audio_input],
         outputs=[text_output]
     )
     transcrip_button.click(
         process_transcribe_input,
-        inputs=[input_type, text_input, audio_input],
         outputs=[text_output]
     )

 @spaces.GPU
+def process_input(audio_file=None):
     for partial_message in process_audio(audio_file):
         yield partial_message
 @spaces.GPU
+def process_transcribe_input(audio_file=None):
     for partial_message in process_audio(audio_file, transcript=True):
         yield partial_message
 class StopOnTokens(StoppingCriteria):
     def __call__(self, input_ids: torch.LongTensor, scores: torch.FloatTensor, **kwargs) -> bool:
         # encode </s> token
 with gr.Blocks() as iface:
     gr.Markdown("# Llama3.1-S: checkpoint Aug 19, 2024")
     gr.Markdown("Enter text to convert to audio, then submit the audio to generate text or Upload Audio")
+    gr.Markdown("Powered by [Homebrew Ltd](https://homebrew.ltd/) | [Read our blog post](https://homebrew.ltd/blog/llama3-just-got-ears)")
     with gr.Row():
         input_type = gr.Radio(["text", "audio"], label="Input Type", value="audio")
         text_input = gr.Textbox(label="Text Input", visible=False)
     submit_button.click(
         process_input,
+        inputs=[audio_input],
         outputs=[text_output]
     )
     transcrip_button.click(
         process_transcribe_input,
+        inputs=[audio_input],
         outputs=[text_output]
     )