Spaces:

Yhhxhfh
/

dgdgdgdgd

Runtime error

Yhhxhfh commited on Sep 22

Commit

35f7013

•

1 Parent(s): c4c21c0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -30,9 +30,19 @@ def load_and_train():
     tokenizer = GPT2Tokenizer.from_pretrained(model_name)
     model = GPT2LMHeadModel.from_pretrained(model_name)
-    # Cargar los datasets en memoria (RAM)
-    dataset_humanizado = load_dataset('daily_dialog', split='train', cache_dir='/dev/shm', trust_remote_code=True)
-    dataset_codigo = load_dataset('code_search_net', split='train', cache_dir='/dev/shm', trust_remote_code=True)
     print("Daily Dialog columns:", dataset_humanizado.column_names)
     print("Code Search Net columns:", dataset_codigo.column_names)

     tokenizer = GPT2Tokenizer.from_pretrained(model_name)
     model = GPT2LMHeadModel.from_pretrained(model_name)
+    # Intentar cargar los datasets con manejo de errores
+    try:
+        dataset_humanizado = load_dataset('daily_dialog', split='train', cache_dir='/dev/shm', trust_remote_code=True)
+        dataset_codigo = load_dataset('code_search_net', split='train', cache_dir='/dev/shm', trust_remote_code=True)
+    except Exception as e:
+        print(f"Error al cargar los datasets: {e}")
+        # Si hay un error, podrías intentar cargar un dataset alternativo o reintentar después de un tiempo
+        time.sleep(60)  # Esperar 60 segundos antes de reintentar
+        try:
+            dataset_humanizado = load_dataset('alternative_dataset', split='train', cache_dir='/dev/shm', trust_remote_code=True)
+        except Exception as e:
+            print(f"Error al cargar el dataset alternativo: {e}")
+            return
     print("Daily Dialog columns:", dataset_humanizado.column_names)
     print("Code Search Net columns:", dataset_codigo.column_names)