Spaces:

Fred808
/

808-GPT2

Sleeping

Fred808 commited on 22 days ago

Commit

dd25f43

verified ·

1 Parent(s): 9ddd59a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,8 +16,8 @@ app = FastAPI()
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
-# Hugging Face Inference API endpoint for BLOOM-7B
-API_URL = "https://api-inference.huggingface.co/models/bigscience/bloom-7b1"  # Use BLOOM-7B
 headers = {"Authorization": f"Bearer {token}"}
 # Define request body schema
@@ -49,7 +49,11 @@ async def generate_text(request: TextGenerationRequest):
         # Send request to the Hugging Face Inference API
         response = requests.post(API_URL, headers=headers, json=payload)
-        response.raise_for_status()  # Raise an error for bad responses (4xx or 5xx)
         # Extract the generated text from the response
         generated_text = response.json()[0]["generated_text"]

 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# Hugging Face Inference API endpoint for DeepSeek
+API_URL = "https://api-inference.huggingface.co/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-32B"  # Replace with the correct model ID
 headers = {"Authorization": f"Bearer {token}"}
 # Define request body schema
         # Send request to the Hugging Face Inference API
         response = requests.post(API_URL, headers=headers, json=payload)
+        # Check for errors in the response
+        if response.status_code != 200:
+            logger.error(f"API Error: {response.status_code} - {response.text}")
+            raise HTTPException(status_code=response.status_code, detail=response.text)
         # Extract the generated text from the response
         generated_text = response.json()[0]["generated_text"]