AIgroup-CVM-utokyohospital
/

Llama-2-70b-chat-4bit-japanese

Text Generation

Model card Files Files and versions Community

stardust-coder commited on Aug 10, 2023

Commit

4ed041a

•

1 Parent(s): cf6dfa9

Update README.md

Files changed (1) hide show

README.md +2 -6

README.md CHANGED Viewed

@@ -54,12 +54,12 @@ model = AutoModelForCausalLM.from_pretrained(model_id, quantization_config=bnb_c
 # Load weights
 peft_name = "AIgroup-CVM-utokyohospital/Llama-2-70b-chat-4bit-japanese"
-model_peft = PeftModel.from_pretrained(
     model,
     peft_name,
     device_map="auto"
 )
-model_peft.eval()
 device = "cuda:0"
@@ -70,10 +70,6 @@ with torch.no_grad():
             temperature=0.0,
             repetition_penalty=1.00)
   print(tokenizer.decode(outputs[0], skip_special_tokens=True))
-  outputs = model_peft.generate(**inputs,
-            temperature=0.0,
-            repetition_penalty=1.00)
-  print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
 ## Sample Responses

 # Load weights
 peft_name = "AIgroup-CVM-utokyohospital/Llama-2-70b-chat-4bit-japanese"
+model = PeftModel.from_pretrained(
     model,
     peft_name,
     device_map="auto"
 )
+model.eval()
 device = "cuda:0"
             temperature=0.0,
             repetition_penalty=1.00)
   print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```
 ## Sample Responses