Spaces:

JoPmt
/

Starcoder2_smpl_demo

Runtime error

JoPmt commited on Mar 2, 2024

Commit

452b214

verified ·

1 Parent(s): 1ca0f5f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,15 +1,14 @@
 from accelerate import Accelerator
-from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM
 import gradio as gr
 import os, random, gc
 import torch
 accelerator=Accelerator(cpu=True)
-mdl = "bigcode/starcoder2-3b"
-tokenizer = AutoTokenizer.from_pretrained(mdl)
-model = accelerator.prepare(AutoModelForCausalLM.from_pretrained(mdl, torch_dtype=torch.bfloat16))
 def plex(ynputs):
     onputs = tokenizer.encode(""+ynputs+"", return_tensors="pt").to("cpu")
-    iutputs = model.generate(onputs, max_new_tokens=350)
     return tokenizer.decode(iutputs[0])
 with gr.Blocks() as iface:
     zutput=gr.Textbox(lines=5)

 from accelerate import Accelerator
+from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig
 import gradio as gr
 import os, random, gc
 import torch
 accelerator=Accelerator(cpu=True)
+tokenizer = AutoTokenizer.from_pretrained("bigcode/starcoder2-3b")
+pipe = accelerator.prepare(AutoModelForCausalLM.from_pretrained("bigcode/starcoder2-3b", torch_dtype=torch.bfloat16))
 def plex(ynputs):
     onputs = tokenizer.encode(""+ynputs+"", return_tensors="pt").to("cpu")
+    iutputs = pipe.generate(onputs, max_new_tokens=350)
     return tokenizer.decode(iutputs[0])
 with gr.Blocks() as iface:
     zutput=gr.Textbox(lines=5)