zerogpu-2

Running on Zero

rphrp1985 commited on Jun 13, 2024

Commit

a3c3c74

verified ·

1 Parent(s): 0d50feb

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -64,7 +64,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer
 # model_id = "mistralai/Mistral-7B-v0.3"
-model_id = "CohereForAI/aya-23-8B"
 tokenizer = AutoTokenizer.from_pretrained(
@@ -118,6 +118,7 @@ def respond(
     messages.append({"role": "user", "content": message})
     input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(accelerator.device) #.to('cuda')
 ## <BOS_TOKEN><|START_OF_TURN_TOKEN|><|USER_TOKEN|>Hello, how are you?<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>
     # with autocast():
     gen_tokens = model.generate(
@@ -129,6 +130,7 @@ def respond(
     gen_text = tokenizer.decode(gen_tokens[0])
     print(gen_text)
     yield gen_text

 # model_id = "mistralai/Mistral-7B-v0.3"
+model_id = "CohereForAI/aya-23-35B"
 tokenizer = AutoTokenizer.from_pretrained(
     messages.append({"role": "user", "content": message})
     input_ids = tokenizer.apply_chat_template(messages, tokenize=True, add_generation_prompt=True, return_tensors="pt").to(accelerator.device) #.to('cuda')
+    print(input_ids)
 ## <BOS_TOKEN><|START_OF_TURN_TOKEN|><|USER_TOKEN|>Hello, how are you?<|END_OF_TURN_TOKEN|><|START_OF_TURN_TOKEN|><|CHATBOT_TOKEN|>
     # with autocast():
     gen_tokens = model.generate(
     gen_text = tokenizer.decode(gen_tokens[0])
     print(gen_text)
     yield gen_text