LIRAGTBackup

Runtime error

alexkueck commited on Jan 6

Commit

8937e12

•

1 Parent(s): 226612a

Update utils.py

Files changed (1) hide show

utils.py CHANGED Viewed

@@ -144,13 +144,13 @@ def normalise_prompt (prompt):
     #Punktuierung entfernen
     tokens = [word for word in tokens if word.isalnum()]
     # Stop Word Entfernung
-    nltk.download('stopwords')
-    stop_words = set(stopwords.words('english'))
-    tokens = [word for word in tokens if not word in stop_words]
     # 5. Lemmatisierung: Worte in Grundform bringen, um Text besser vergleichen zu können
-    nltk.download('wordnet')
-    lemmatizer = WordNetLemmatizer()
-    tokens = [lemmatizer.lemmatize(word) for word in tokens]
     # 6. Handling Special Characters (Remove non-alphanumeric characters)
     tokens = [re.sub(r'\W+', '', word) for word in tokens]
     # 7. Spell Check (optional, using a library like pyspellchecker)

     #Punktuierung entfernen
     tokens = [word for word in tokens if word.isalnum()]
     # Stop Word Entfernung
+    #nltk.download('stopwords')
+    #stop_words = set(stopwords.words('english'))
+    #tokens = [word for word in tokens if not word in stop_words]
     # 5. Lemmatisierung: Worte in Grundform bringen, um Text besser vergleichen zu können
+    #nltk.download('wordnet')
+    #lemmatizer = WordNetLemmatizer()
+    #tokens = [lemmatizer.lemmatize(word) for word in tokens]
     # 6. Handling Special Characters (Remove non-alphanumeric characters)
     tokens = [re.sub(r'\W+', '', word) for word in tokens]
     # 7. Spell Check (optional, using a library like pyspellchecker)