Spaces:

freQuensy23
/

books-semantic-search

Runtime error

App Files Files Community

freQuensy23 commited on Mar 19

Commit

1370a68

•

1 Parent(s): c9c4854

[FIX]

Browse files

Files changed (2) hide show

app.py +11 -9
requirements.txt +1 -0

app.py CHANGED Viewed

@@ -1,25 +1,26 @@
 import translator
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain.text_splitter import SentenceTransformersTokenTextSplitter
-from langchain_community.embeddings import SentenceTransformerEmbeddings
 from langchain_community.retrievers import BM25Retriever
 from langchain_community.vectorstores.utils import DistanceStrategy
-from  langchain_community.vectorstores import FAISS
 import gradio as gr
 import re
 print('All imports are successful')
 model = "msmarco-distilbert-base-tas-b"
-try:
-    embeddings = SentenceTransformerEmbeddings(model_name=model)
-except:
-    embeddings = SentenceTransformerEmbeddings(model_name=model)
 prev_files = None
 retriever = None
-def handle_files_and_query(query, files, chunk_overlap=50, token_per_chunk=256, bm_25_answers=200, translate_to_ru=False):
     results = ""
     global prev_files, retriever
     if not (isinstance(files, str) or isinstance(files[0], str)):
@@ -67,11 +68,12 @@ interface = gr.Interface(
         gr.Slider(minimum=1, maximum=100, value=50, label="Chunk Overlap"),
         gr.Slider(minimum=64, maximum=512, value=256, label="Tokens Per Chunk (чем больше - тем бОльшие куски книги "
                                                             "сможем находить)"),
-        gr.Slider(minimum=1, maximum=1000, value=200, label="BM25 Answers (чем больше - тем больше будем учитывать неявные смысловые сравнения слов)"),
         gr.Checkbox(label="Translate to Russian", value=False),
     ],
     outputs="text",
     title="Similarity Search for eksmo books"
 )
-interface.launch(share=True)

+from dotenv import load_dotenv
+load_dotenv()
 import translator
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain.text_splitter import SentenceTransformersTokenTextSplitter
+from langchain_community.embeddings import OpenAIEmbeddings
 from langchain_community.retrievers import BM25Retriever
 from langchain_community.vectorstores.utils import DistanceStrategy
+from langchain_community.vectorstores import FAISS
 import gradio as gr
 import re
 print('All imports are successful')
 model = "msmarco-distilbert-base-tas-b"
+embeddings = OpenAIEmbeddings()
 prev_files = None
 retriever = None
+def handle_files_and_query(query, files, chunk_overlap=50, token_per_chunk=256, bm_25_answers=200,
+                           translate_to_ru=False):
     results = ""
     global prev_files, retriever
     if not (isinstance(files, str) or isinstance(files[0], str)):
         gr.Slider(minimum=1, maximum=100, value=50, label="Chunk Overlap"),
         gr.Slider(minimum=64, maximum=512, value=256, label="Tokens Per Chunk (чем больше - тем бОльшие куски книги "
                                                             "сможем находить)"),
+        gr.Slider(minimum=1, maximum=1000, value=200,
+                  label="BM25 Answers (чем больше - тем больше будем учитывать неявные смысловые сравнения слов)"),
         gr.Checkbox(label="Translate to Russian", value=False),
     ],
     outputs="text",
     title="Similarity Search for eksmo books"
 )
+interface.queue(P=1).launch(share=True)

requirements.txt CHANGED Viewed

@@ -164,3 +164,4 @@ xlrd==2.0.1
 XlsxWriter==3.1.9
 yarl==1.9.2
 zipp==3.15.0

 XlsxWriter==3.1.9
 yarl==1.9.2
 zipp==3.15.0
+python-dotenv~=1.0.1