norallm
/

normistral-11b-warm

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

davda54 commited on 12 days ago

Commit

035cc8a

·

verified ·

1 Parent(s): 6344c0e

Update README.md

Files changed (1) hide show

README.md +8 -1

README.md CHANGED Viewed

@@ -135,6 +135,13 @@ model = AutoModelForCausalLM.from_pretrained("norallm/normistral-11b").cuda().ev
 prompt = """Engelsk: {0}
 Bokmål:"""
 # Generation function
 @torch.no_grad()
 def generate(text):
@@ -144,7 +151,7 @@ def generate(text):
         input_ids,
         max_new_tokens=64,
         do_sample=False,
-        eos_token_id=tokenizer('\n').input_ids
     )
     return tokenizer.decode(prediction[0, input_ids.size(1):]).strip()

 prompt = """Engelsk: {0}
 Bokmål:"""
+# Define tokens that should end the generation (any token with a newline)
+eos_token_ids = [
+    token_id
+    for token_id in range(tokenizer.vocab_size)
+    if '\n' in tokenizer.decode([token_id])
+]
 # Generation function
 @torch.no_grad()
 def generate(text):
         input_ids,
         max_new_tokens=64,
         do_sample=False,
+        eos_token_id=eos_token_ids
     )
     return tokenizer.decode(prediction[0, input_ids.size(1):]).strip()