Spaces:

Subodh358
/

NeuralRootsAI

Runtime error

Subodh358 commited on Jul 8, 2024

Commit

7431f37

verified ·

1 Parent(s): 8d1870e

Upload 3 files

Files changed (3) hide show

Dockerfile CHANGED Viewed

@@ -1,6 +1,3 @@
-# read the doc: https://huggingface.co/docs/hub/spaces-sdks-docker
-# you will also find guides on how best to write your Dockerfile
 FROM python:3.9
 RUN useradd -m -u 1000 user
@@ -13,4 +10,34 @@ COPY --chown=user ./requirements.txt requirements.txt
 RUN pip install --no-cache-dir --upgrade -r requirements.txt
 COPY --chown=user . /app
-CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "7860"]

 FROM python:3.9
 RUN useradd -m -u 1000 user
 RUN pip install --no-cache-dir --upgrade -r requirements.txt
 COPY --chown=user . /app
+CMD ["uvicorn", "main:app", "--host", "0.0.0.0", "--port", "7860"]
+# FROM python:3.9
+# # Set environment variables
+# ENV MODEL_NAME="meta-llama/Meta-Llama-3-8B-Instruct"
+# ENV TRANSFORMERS_CACHE="/app/transformers_cache"
+# ENV LC_ALL=C.UTF-8
+# ENV LANG=C.UTF-8
+# # Install additional dependencies if needed
+# RUN pip install --no-cache-dir fastapi uvicorn
+# # Create the app directory and set permissions
+# RUN mkdir /app && chmod -R 777 /app
+# # Set the working directory
+# WORKDIR /app
+# # Copy your model and code to the container
+# COPY ./app.py /app
+# COPY ./Dockerfile /app
+# COPY ./requirements.txt /app
+# # Expose the port FastAPI will run on
+# EXPOSE 8000
+# # Run FastAPI server
+# CMD ["uvicorn", "app:app", "--host", "0.0.0.0", "--port", "8000"]

app.py CHANGED Viewed

@@ -1,7 +1,22 @@
-from fastapi import FastAPI
 app = FastAPI()
 @app.get("/")
 def greet_json():
     return {"Hello": "World!"}

+from fastapi import FastAPI, HTTPException
+from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 app = FastAPI()
+# Load model and tokenizer
+model_name = "meta-llama/Meta-Llama-3-8B-Instruct"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForCausalLM.from_pretrained(model_name)
+generator = pipeline("text-generation", model=model, tokenizer=tokenizer)
 @app.get("/")
 def greet_json():
     return {"Hello": "World!"}
+@app.post("/generate")
+def generate_text(prompt: str):
+    try:
+        generated_text = generator(prompt, max_length=50)
+        return {"generated_text": generated_text[0]['generated_text']}
+    except Exception as e:
+        raise HTTPException(status_code=500, detail=str(e))

requirements.txt CHANGED Viewed

@@ -1,2 +1,4 @@
 fastapi
-uvicorn[standard]

 fastapi
+transformers
+uvicorn
+torch