Spaces:

HaggiVaggi
/

FindMyMovie

Sleeping

App Files Files Community

HaggiVaggi commited on Dec 15, 2023

Commit

ee1c320

1 Parent(s): 600a6d6

Update pages/Подбор фильмов по описанию✏️🔍.py

Browse files

Files changed (1) hide show

pages/Подбор фильмов по описанию✏️🔍.py +12 -14

pages/Подбор фильмов по описанию✏️🔍.py CHANGED Viewed

@@ -7,26 +7,22 @@ import numpy as np
 @st.cache_data
 def load_data(url):
-    df = pd.read_csv(url)  # 👈 Download the data
     return df
-df = load_data('data/final_data.csv')
 @st.cache_data
 def embedding_and_index():
     embeddings_array = np.load('data/embeddings_final.npy')
     index = faiss.read_index('data/desc_faiss_index_final.index')
-    return(embeddings_array, index)
-embeddings_array, index = embedding_and_index()
-@st.cache_resource
 def load_tokenizer_and_model():
     tokenizer = AutoTokenizer.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
     model = AutoModel.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
     return tokenizer, model
-@st.cache_resource
 def encode_description(description, tokenizer, model):
     tokens = tokenizer(description, return_tensors="pt")
     with torch.no_grad():
@@ -36,6 +32,7 @@ def encode_description(description, tokenizer, model):
 st.header("Подбор фильмов по описанию ✏️🔍")
 df = load_data('data/final_data.csv')
 embeddings_array, index = embedding_and_index()
 tokenizer, model = load_tokenizer_and_model()
@@ -45,16 +42,17 @@ user_input = st.text_input("Введите описание фильма:", valu
 if st.button("Искать🔍🎦"):
     if user_input:
-# Векторизация введенного запроса
-        input_embedding = encode_description(user_input)
-# Поиск с использованием Faiss
-        _, sorted_indices = index.search(input_embedding.reshape(1, -1), 5)  # Изменил на 5
-# Используйте индексы для извлечения строк из DataFrame
-        recs = df2.iloc[sorted_indices[0]].reset_index(drop=True)
         recs.index = recs.index + 1
 # Вывод рекомендованных фильмов с изображениями
         st.subheader("Рекомендованные фильмы 🎉:")
         for i in range(5):

 @st.cache_data
 def load_data(url):
+    df = pd.read_csv(url)
     return df
 @st.cache_data
 def embedding_and_index():
     embeddings_array = np.load('data/embeddings_final.npy')
     index = faiss.read_index('data/desc_faiss_index_final.index')
+    return embeddings_array, index
+@st.cache_data
 def load_tokenizer_and_model():
     tokenizer = AutoTokenizer.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
     model = AutoModel.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
     return tokenizer, model
+@st.cache_data
 def encode_description(description, tokenizer, model):
     tokens = tokenizer(description, return_tensors="pt")
     with torch.no_grad():
 st.header("Подбор фильмов по описанию ✏️🔍")
+# Загрузка данных
 df = load_data('data/final_data.csv')
 embeddings_array, index = embedding_and_index()
 tokenizer, model = load_tokenizer_and_model()
 if st.button("Искать🔍🎦"):
     if user_input:
+        # Векторизация введенного запроса с использованием переданных tokenizer и model
+        input_embedding = encode_description(user_input, tokenizer, model)
+        # Поиск с использованием Faiss
+        _, sorted_indices = index.search(input_embedding.reshape(1, -1), 5)
+        # Используйте индексы для извлечения строк из DataFrame
+        recs = df.iloc[sorted_indices[0]].reset_index(drop=True)
         recs.index = recs.index + 1
 # Вывод рекомендованных фильмов с изображениями
         st.subheader("Рекомендованные фильмы 🎉:")
         for i in range(5):