Spaces:

HaggiVaggi
/

FindMyMovie

Sleeping

HaggiVaggi commited on Dec 15, 2023

Commit

841911a

1 Parent(s): ee1c320

Update pages/Подбор фильмов по описанию✏️🔍.py

Files changed (1) hide show

pages/Подбор фильмов по описанию✏️🔍.py CHANGED Viewed

@@ -17,10 +17,11 @@ def embedding_and_index():
     return embeddings_array, index
 @st.cache_data
-def load_tokenizer_and_model():
-    tokenizer = AutoTokenizer.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
     model = AutoModel.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
-    return tokenizer, model
 @st.cache_data
 def encode_description(description, tokenizer, model):
@@ -35,13 +36,14 @@ st.header("Подбор фильмов по описанию ✏️🔍")
 # Загрузка данных
 df = load_data('data/final_data.csv')
 embeddings_array, index = embedding_and_index()
-tokenizer, model = load_tokenizer_and_model()
 # Пользовательский ввод
 user_input = st.text_input("Введите описание фильма:", value="", help="Чем подробнее будет ваше описание, тем точнее мы сможем подобрать для вас фильм 🤗'")
 if st.button("Искать🔍🎦"):
     if user_input:
         # Векторизация введенного запроса с использованием переданных tokenizer и model
         input_embedding = encode_description(user_input, tokenizer, model)

     return embeddings_array, index
 @st.cache_data
+def load_model():
     model = AutoModel.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
+    return model
+tokenizer = AutoTokenizer.from_pretrained("DeepPavlov/rubert-base-cased-sentence")
 @st.cache_data
 def encode_description(description, tokenizer, model):
 # Загрузка данных
 df = load_data('data/final_data.csv')
 embeddings_array, index = embedding_and_index()
+model = load_model()
 # Пользовательский ввод
 user_input = st.text_input("Введите описание фильма:", value="", help="Чем подробнее будет ваше описание, тем точнее мы сможем подобрать для вас фильм 🤗'")
 if st.button("Искать🔍🎦"):
     if user_input:
         # Векторизация введенного запроса с использованием переданных tokenizer и model
         input_embedding = encode_description(user_input, tokenizer, model)