Spaces:

captain-awesome
/

docuverse

Runtime error

App Files Files Community

captain-awesome commited on Sep 4, 2023

Commit

b62d7f8

1 Parent(s): 29f8c44

Update app.py

Browse files

Files changed (1) hide show

app.py +19 -2

app.py CHANGED Viewed

@@ -135,6 +135,23 @@ def create_vector_database(uploaded_files):
     # docx_loader = DirectoryLoader("data/", glob="**/*.docx", loader_cls=UnstructuredWordDocumentLoader)
     # odt_loader = DirectoryLoader("data/", glob="**/*.odt", loader_cls=UnstructuredODTLoader)
     # notebook_loader = DirectoryLoader("data/", glob="**/*.ipynb", loader_cls=NotebookLoader)
     # Load documents from uploaded files using the appropriate loaders
     loaded_documents = []
@@ -142,10 +159,10 @@ def create_vector_database(uploaded_files):
     # file_extension = os.path.splitext(uploaded_file.name)[-1].lower()[1:]
         file_extension = os.path.splitext(uploaded_file.name)[-1][1:].lower()
         if file_extension in loaders:
-            loader_cls = loaders[file_extension]
             loader = loader_cls.load(uploaded_file.name) # Pass the file path to the loader constructor
             # content = uploaded_file.read()  # Read the file content
-            # loaded_documents.extend(loader.load(content))
     # all_loaders = [pdf_loader, markdown_loader, text_loader, csv_loader, python_loader, epub_loader, html_loader, ppt_loader, pptx_loader, doc_loader, docx_loader, odt_loader, notebook_loader]

     # docx_loader = DirectoryLoader("data/", glob="**/*.docx", loader_cls=UnstructuredWordDocumentLoader)
     # odt_loader = DirectoryLoader("data/", glob="**/*.odt", loader_cls=UnstructuredODTLoader)
     # notebook_loader = DirectoryLoader("data/", glob="**/*.ipynb", loader_cls=NotebookLoader)
+    # FILE_LOADER_MAPPING = {
+    #     ".csv": (CSVLoader, {"encoding": "utf-8"}),
+    #     ".doc": (UnstructuredWordDocumentLoader, {}),
+    #     ".docx": (UnstructuredWordDocumentLoader, {}),
+    #     ".enex": (EverNoteLoader, {}),
+    #     ".epub": (UnstructuredEPubLoader, {}),
+    #     ".html": (UnstructuredHTMLLoader, {}),
+    #     ".md": (UnstructuredMarkdownLoader, {}),
+    #     ".odt": (UnstructuredODTLoader, {}),
+    #     ".pdf": (PyPDFLoader, {}),
+    #     ".ppt": (UnstructuredPowerPointLoader, {}),
+    #     ".pptx": (UnstructuredPowerPointLoader, {}),
+    #     ".txt": (TextLoader, {"encoding": "utf8"}),
+    #     ".ipynb": (NotebookLoader, {}),
+    #     ".py": (PythonLoader, {}),
+    #     # Add more mappings for other file extensions and loaders as needed
+    # }
     # Load documents from uploaded files using the appropriate loaders
     loaded_documents = []
     # file_extension = os.path.splitext(uploaded_file.name)[-1].lower()[1:]
         file_extension = os.path.splitext(uploaded_file.name)[-1][1:].lower()
         if file_extension in loaders:
+            loader_cls = loaders[file_extension](uploaded_file)
             loader = loader_cls.load(uploaded_file.name) # Pass the file path to the loader constructor
             # content = uploaded_file.read()  # Read the file content
+            loaded_documents.extend(loader.load(content))
     # all_loaders = [pdf_loader, markdown_loader, text_loader, csv_loader, python_loader, epub_loader, html_loader, ppt_loader, pptx_loader, doc_loader, docx_loader, odt_loader, notebook_loader]