Spaces:

capradeepgujaran
/

ChatWithDocuments

Running

capradeepgujaran commited on 5 days ago

Commit

ea34aa6

•

1 Parent(s): 1b42b46

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,6 +11,8 @@ from llama_index.llms.openai import OpenAI
 from llama_index.core import get_response_synthesizer
 from dotenv import load_dotenv
 from sentence_transformers import SentenceTransformer, util
 # Set up logging configuration
 logging.basicConfig(level=logging.INFO, format='%(asctime)s | %(levelname)s | %(message)s')
@@ -128,7 +130,13 @@ def process_upload(api_key, files):
 def calculate_similarity(response, ground_truth):
     response_embedding = sentence_model.encode(response, convert_to_tensor=True)
     truth_embedding = sentence_model.encode(ground_truth, convert_to_tensor=True)
-    similarity = util.pytorch_cos_sim(response_embedding, truth_embedding).item()
     return similarity * 100  # Convert to percentage
 def query_app(query, model_name, use_similarity_check, openai_api_key):
@@ -229,4 +237,4 @@ def main():
     demo.launch()
 if __name__ == "__main__":
-    main()

 from llama_index.core import get_response_synthesizer
 from dotenv import load_dotenv
 from sentence_transformers import SentenceTransformer, util
+from sklearn.metrics.pairwise import cosine_similarity
+import numpy as np
 # Set up logging configuration
 logging.basicConfig(level=logging.INFO, format='%(asctime)s | %(levelname)s | %(message)s')
 def calculate_similarity(response, ground_truth):
     response_embedding = sentence_model.encode(response, convert_to_tensor=True)
     truth_embedding = sentence_model.encode(ground_truth, convert_to_tensor=True)
+    # Normalize the embeddings
+    response_embedding = response_embedding / np.linalg.norm(response_embedding)
+    truth_embedding = truth_embedding / np.linalg.norm(truth_embedding)
+    # Calculate cosine similarity using sklearn's cosine_similarity function
+    similarity = cosine_similarity(response_embedding.reshape(1, -1), truth_embedding.reshape(1, -1))[0][0]
     return similarity * 100  # Convert to percentage
 def query_app(query, model_name, use_similarity_check, openai_api_key):
     demo.launch()
 if __name__ == "__main__":
+    main()