Spaces:

ljyflores
/

simplification-model-app

Sleeping

App Files Files Community

ljyflores commited on Dec 16, 2023

Commit

851657f

1 Parent(s): ed8d715

Update app

Browse files

Files changed (1) hide show

app.py +7 -53

app.py CHANGED Viewed

@@ -1,6 +1,6 @@
 import streamlit as st
-from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM
 dataset_example_dictionary = {
     "cochrane": [
@@ -33,28 +33,9 @@ def load(dataset_name, model_variant_name):
         model=model_dictionary[dataset_name][model_variant_name]
         )
 def predict(text, pipeline):
-    return pipeline(text, max_length=768)
-# @st.cache_resource
-# def load(dataset_name, model_variant_name):
-#     tokenizer = AutoTokenizer.from_pretrained(model_dictionary[dataset_name][model_variant_name])
-#     model = AutoModelForSeq2SeqLM.from_pretrained(model_dictionary[dataset_name][model_variant_name])
-#     return pipeline("text2text-generation", model="ljyflores/bart_xsum_cochrane_finetune")
-# def encode(text, _tokenizer):
-#     """This function takes a batch of samples,
-#     and tokenizes them into IDs for the model."""
-#     # Tokenize the Findings (the input)
-#     model_inputs = _tokenizer(
-#         [text], padding=True, truncation=True, return_tensors="pt"
-#     )
-#     return model_inputs
-# def predict(text, model, tokenizer):
-#     model_inputs = encode(text, tokenizer)
-#     model_outputs = model.generate(**model_inputs, max_length=768).detach()
-#     return tokenizer.batch_decode(model_outputs)
 def clean(s):
     return s.replace("<s>","").replace("</s>","")
@@ -77,38 +58,11 @@ st.text_area("Text to Simplify:", key="text", height=275)
 # Load model and run inference
 if st.button("Simplify!"):
-    # # Number 1
-    # # tokenizer_baseline, model_baseline = load(dataset_option, "baseline")
-    # # model_outputs_baseline = predict(st.session_state.text, model_baseline, tokenizer_baseline)[0]
-    # pipeline_baseline = load(dataset_option, "baseline")
-    # # model_outputs_baseline = predict(st.session_state.text, pipeline_baseline)[0]["generated_text"]
-    # # pipeline_baseline = pipeline(
-    # #     "text2text-generation",
-    # #     model=model_dictionary[dataset_option]["baseline"]
-    # #     )
-    # model_outputs_baseline = pipeline_baseline(
-    #     st.session_state.text,
-    #     max_length=768,
-    #     do_sample=False
-    #     )
-    # st.write(f"Baseline: {clean(model_outputs_baseline)}")
-    # # Number 2
-    # tokenizer_ul, model_ul = load(dataset_option, "ul")
-    # model_outputs_ul = predict(st.session_state.text, model_ul, tokenizer_ul)[0]
     pipeline_ul = load(dataset_option, "ul")
-    # model_outputs_ul = predict(st.session_state.text, pipeline_ul)[0]["generated_text"]
-    # pipeline_ul = pipeline(
-    #     "text2text-generation",
-    #     model=model_dictionary[dataset_option]["ul"]
-    #     )
-    model_outputs_ul = pipeline_ul(
-        st.session_state.text,
-        max_length=768,
-        do_sample=False
-        )
     st.write(f"Unlikelihood Learning: {clean(model_outputs_ul)}")

 import streamlit as st
+from transformers import pipeline
 dataset_example_dictionary = {
     "cochrane": [
         model=model_dictionary[dataset_name][model_variant_name]
         )
+@st.cache_data()
 def predict(text, pipeline):
+    return pipeline(text, max_length=768, do_sample=False)
 def clean(s):
     return s.replace("<s>","").replace("</s>","")
 # Load model and run inference
 if st.button("Simplify!"):
+    pipeline_baseline = load(dataset_option, "baseline")
+    model_outputs_baseline = predict(st.session_state.text, pipeline_baseline)[0]["generated_text"]
+    st.write(f"Baseline: {clean(model_outputs_baseline)}")
     pipeline_ul = load(dataset_option, "ul")
+    model_outputs_ul = predict(st.session_state.text, pipeline_ul)[0]["generated_text"]
     st.write(f"Unlikelihood Learning: {clean(model_outputs_ul)}")