Spaces:

GameScribes
/

Multipurpose-AI-Agent-Development

Starting on T4

devve1 commited on Jun 19

Commit

77ed01c

•

1 Parent(s): 165e041

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -317,13 +317,6 @@ def load_models_and_documents():
     return client, collection_name, llm, dense_model, sparse_model
-def create_document(text: str, i: int):
-    index = -1
-    for chunk in text_splitter.split_text(text):
-        if text_splitter._add_start_index:
-            index = text.find(chunk, index + 1)
-        documents.append(chunk)
 def chunk_documents(docs, dense_model, sparse_model):
     text_splitter = SemanticChunker(
         dense_model,
@@ -333,8 +326,16 @@ def chunk_documents(docs, dense_model, sparse_model):
     texts = []
     for doc in docs:
         texts.append(doc.page_content)
     documents = []
     joblib.Parallel(n_jobs=joblib.cpu_count(), verbose=1, require='sharedmem')(
         joblib.delayed(create_document)(text, i) for i, text in enumerate(texts))

     return client, collection_name, llm, dense_model, sparse_model
 def chunk_documents(docs, dense_model, sparse_model):
     text_splitter = SemanticChunker(
         dense_model,
     texts = []
     for doc in docs:
         texts.append(doc.page_content)
     documents = []
+    def create_document(text: str, i: int):
+        index = -1
+        for chunk in text_splitter.split_text(text):
+            if text_splitter._add_start_index:
+                index = text.find(chunk, index + 1)
+        documents.append(chunk)
     joblib.Parallel(n_jobs=joblib.cpu_count(), verbose=1, require='sharedmem')(
         joblib.delayed(create_document)(text, i) for i, text in enumerate(texts))