Spaces:

CamiloVega
/

News_AI

Runtime error

App Files Files Community

CamiloVega commited on 10 days ago

Commit

5cbb64a

verified ·

1 Parent(s): ed59cc5

Update app.py

Browse files

Files changed (1) hide show

app.py +11 -13

app.py CHANGED Viewed

@@ -17,7 +17,7 @@ logging.basicConfig(
     level=logging.INFO,
     format='%(asctime)s - %(levelname)s - %(message)s'
 )
-logger = logging.getLogger(__name__)
 # Obtener token de Hugging Face
 HUGGINGFACE_TOKEN = os.getenv('HUGGINGFACE_TOKEN')
@@ -29,8 +29,8 @@ if not HUGGINGFACE_TOKEN:
 login(token=HUGGINGFACE_TOKEN)
 class NewsGenerator:
-    def _init_(self):
-        self.device = "cuda" if torch.cuda.is_available() else "cpu"
         self.whisper_model = None
         self.llm_model = None
         self.tokenizer = None
@@ -39,7 +39,7 @@ class NewsGenerator:
         self._load_models()
     def _load_models(self):
-        """Carga optimizada de modelos para GPU/CPU"""
         try:
             # Modelo DeepSeek
             model_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
@@ -49,19 +49,19 @@ class NewsGenerator:
                 token=HUGGINGFACE_TOKEN
             )
-            # Configuración para GPU con manejo de memoria
             self.llm_model = AutoModelForCausalLM.from_pretrained(
                 model_name,
-                device_map="auto",
-                torch_dtype=torch.float16 if self.device == "cuda" else torch.float32,
                 low_cpu_mem_usage=True,
                 token=HUGGINGFACE_TOKEN
             ).eval()
-            # Whisper en dispositivo detectado
             self.whisper_model = whisper.load_model(
                 "tiny.en",
-                device=self.device
             )
             logger.info("Modelos cargados exitosamente")
@@ -82,7 +82,6 @@ class NewsGenerator:
     def generate_news(self, prompt: str, max_length: int = 512) -> str:
         """Generación de noticias con DeepSeek"""
         try:
-            # Formato de prompt específico para DeepSeek
             formatted_prompt = (
                 f"<|System|>\nEres un periodista profesional. Genera un artículo noticioso "
                 f"basado en estos datos:\n{prompt}\n<|End|>\n"
@@ -94,7 +93,6 @@ class NewsGenerator:
                 return_tensors="pt"
             ).to(self.device)
-            # Generación optimizada para GPU
             with torch.inference_mode():
                 outputs = self.llm_model.generate(
                     **inputs,
@@ -282,6 +280,6 @@ def create_interface():
     return app
-if __name__ == "__main__":
     app = create_interface()
-    app.launch(share=True)

     level=logging.INFO,
     format='%(asctime)s - %(levelname)s - %(message)s'
 )
+logger = logging.getLogger(__name__)  # Corregido __name__
 # Obtener token de Hugging Face
 HUGGINGFACE_TOKEN = os.getenv('HUGGINGFACE_TOKEN')
 login(token=HUGGINGFACE_TOKEN)
 class NewsGenerator:
+    def __init__(self):  # Corregido __init__
+        self.device = "cpu"  # Forzado a CPU
         self.whisper_model = None
         self.llm_model = None
         self.tokenizer = None
         self._load_models()
     def _load_models(self):
+        """Carga optimizada para CPU"""
         try:
             # Modelo DeepSeek
             model_name = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
                 token=HUGGINGFACE_TOKEN
             )
+            # Configuración para CPU
             self.llm_model = AutoModelForCausalLM.from_pretrained(
                 model_name,
+                device_map="cpu",  # Dispositivo explícito
+                torch_dtype=torch.float32,  # Precisión CPU
                 low_cpu_mem_usage=True,
                 token=HUGGINGFACE_TOKEN
             ).eval()
+            # Whisper en CPU
             self.whisper_model = whisper.load_model(
                 "tiny.en",
+                device="cpu"  # Dispositivo forzado
             )
             logger.info("Modelos cargados exitosamente")
     def generate_news(self, prompt: str, max_length: int = 512) -> str:
         """Generación de noticias con DeepSeek"""
         try:
             formatted_prompt = (
                 f"<|System|>\nEres un periodista profesional. Genera un artículo noticioso "
                 f"basado en estos datos:\n{prompt}\n<|End|>\n"
                 return_tensors="pt"
             ).to(self.device)
             with torch.inference_mode():
                 outputs = self.llm_model.generate(
                     **inputs,
     return app
+if __name__ == "__main__":  # Corregido __main__
     app = create_interface()
+    app.launch()  # Eliminado share=True