p1atdev
/

dart-v1-sft

Text Generation

text-generation-inference

Model card Files Files and versions Community

p1atdev commited on Feb 22

Commit

b1c8d19

•

1 Parent(s): 0df470a

Update README.md

Files changed (1) hide show

README.md +25 -3

README.md CHANGED Viewed

@@ -48,6 +48,23 @@ print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 # rating:sfw, rating:general, 1girl, ahoge, braid, closed eyes, collared dress, dress, flower, full body, hair flower, hair ornament, long hair, night, night sky, outdoors, parted lips, pink flower, pink hair, short sleeves, sky, solo, straight hair, sunflower, very long hair, white flower
 ```
 #### Flash attention (optional)
 Using flash attention can optimize computations, but it is currently only compatible with Linux.
@@ -86,11 +103,16 @@ ort_model = ORTModelForCausalLM.from_pretrained(MODEL_NAME)
 # qunatized version
 # ort_model = ORTModelForCausalLM.from_pretrained(MODEL_NAME, file_name="model_quantized.onnx")
-prompt = "<|bos|><rating>rating:sfw, rating:general</rating><copyright>original</copyright><character></character><general><|long|>1girl<|input_end|>"
-inputs = tokenizer(prompt, return_tensors="pt").input_ids
 with torch.no_grad():
-  outputs = model.generate(inputs, generation_config=generation_config)
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```

 # rating:sfw, rating:general, 1girl, ahoge, braid, closed eyes, collared dress, dress, flower, full body, hair flower, hair ornament, long hair, night, night sky, outdoors, parted lips, pink flower, pink hair, short sleeves, sky, solo, straight hair, sunflower, very long hair, white flower
 ```
+You can use `tokenizer.apply_chat_template` to simplify constructiing of prompts:
+```py
+inputs = tokenizer.apply_chat_template({
+  "rating": "rating:sfw, rating:general",
+  "copyright": "original",
+  "character": "",
+  "general": "1girl",
+  "length": "<|long|>"
+}, tokenize=True) # tokenize=False to preview prompt
+# same as input_ids of "<|bos|><rating>rating:sfw, rating:general</rating><copyright>original</copyright><character></character><general><|long|>1girl<|input_end|>"
+with torch.no_grad():
+  outputs = model.generate(inputs, generation_config=generation_config)
+```
+See [chat_templating document](https://huggingface.co/docs/transformers/main/en/chat_templating) for more detail about `apply_chat_template`.
 #### Flash attention (optional)
 Using flash attention can optimize computations, but it is currently only compatible with Linux.
 # qunatized version
 # ort_model = ORTModelForCausalLM.from_pretrained(MODEL_NAME, file_name="model_quantized.onnx")
+inputs = tokenizer.apply_chat_template({
+  "rating": "rating:sfw, rating:general",
+  "copyright": "original",
+  "character": "",
+  "general": "1girl",
+  "length": "<|long|>"
+}, tokenize=True)
 with torch.no_grad():
+  outputs = ort_model.generate(inputs, generation_config=generation_config)
 print(tokenizer.decode(outputs[0], skip_special_tokens=True))
 ```