Spaces:

EE21
/

ToS-Summarization

Sleeping

App Files Files Community

EmreYY20 commited on Dec 13, 2023

Commit

0f4d5d5

1 Parent(s): 7fbb920

del overlap func

Browse files

Files changed (1) hide show

app.py +6 -28

app.py CHANGED Viewed

@@ -1,8 +1,6 @@
 import streamlit as st
 import PyPDF2
-from extractive_model import summarize_with_textrank
-from nltk.tokenize import sent_tokenize
 # Set page to wide mode
 st.set_page_config(layout="wide")
@@ -15,14 +13,6 @@ def load_pdf(file):
         pdf_text += pdf_reader.pages[page_num].extract_text() or ""
     return pdf_text
-# Function to calculate overlap
-def calculate_overlap(original_text, summary_text):
-    original_sentences = set(sent_tokenize(original_text))
-    summary_sentences = set(sent_tokenize(summary_text))
-    overlap_count = sum(1 for sentence in summary_sentences if sentence in original_sentences)
-    overlap_percentage = (overlap_count / len(original_sentences)) * 100 if original_sentences else 0
-    return overlap_percentage
 # Main app
 def main():
     st.title("Terms of Service Summarizer")
@@ -43,12 +33,6 @@ def main():
             if uploaded_file and user_input:
                 st.warning("Please provide either text input or a PDF file, not both.")
                 return
-            # Perform overlap calculation
-            if 'summary' in st.session_state:
-                overlap = calculate_overlap(file_content, st.session_state.summary)
-                st.session_state.overlap = overlap
             elif uploaded_file:
                 # Extract text from PDF
                 file_content = load_pdf(uploaded_file)
@@ -60,27 +44,21 @@ def main():
                 return
             # Perform extractive summarization
-            summary = ""
             if radio_selection == "Extractive":
-                # Perform extractive summarization
                 summary = summarize_with_textrank(file_content)
                 st.session_state.summary = summary
-                # Calculate and reset overlap
-                st.session_state.overlap = calculate_overlap(file_content, summary)
             # Perform extractive summarization
             if radio_selection == "Abstractive":
                 None
     # Right column: Displaying text after pressing 'Summarize'
     with col3:
-            st.write("Summary:")
-            if st.session_state.get('summary'):
-                st.write(st.session_state.summary)
-                if radio_selection == "Extractive" and st.session_state.get('overlap') is not None:
-                    st.write(f"Overlap with Original Text: {st.session_state.overlap:.2f}%")
 if __name__ == "__main__":
     main()

 import streamlit as st
 import PyPDF2
+from extractive_model import summarize_with_textrank  # Renamed function
 # Set page to wide mode
 st.set_page_config(layout="wide")
         pdf_text += pdf_reader.pages[page_num].extract_text() or ""
     return pdf_text
 # Main app
 def main():
     st.title("Terms of Service Summarizer")
             if uploaded_file and user_input:
                 st.warning("Please provide either text input or a PDF file, not both.")
                 return
             elif uploaded_file:
                 # Extract text from PDF
                 file_content = load_pdf(uploaded_file)
                 return
             # Perform extractive summarization
             if radio_selection == "Extractive":
                 summary = summarize_with_textrank(file_content)
                 st.session_state.summary = summary
             # Perform extractive summarization
             if radio_selection == "Abstractive":
                 None
+                #summary = summarize_with_textrank(file_content)
+                #st.session_state.summary = summary
     # Right column: Displaying text after pressing 'Summarize'
     with col3:
+        st.write("Summary:")
+        if 'summary' in st.session_state:
+            st.write(st.session_state.summary)
 if __name__ == "__main__":
     main()