helenai
/

ibm-granite-granite-8b-code-instruct-ov

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

ibm-granite-granite-8b-code-instruct-ov / inference.py

helenai's picture

Update inference.py

936656b verified 4 months ago

history blame contribute delete

No virus

813 Bytes

	from transformers import AutoTokenizer
	from optimum.intel import OVModelForCausalLM

	model_path = "helenai/ibm-granite-granite-8b-code-instruct-ov"
	tokenizer = AutoTokenizer.from_pretrained(model_path)
	model = OVModelForCausalLM.from_pretrained(model_path)

	# change input text as desired
	chat = [
	{ "role": "user", "content": "Write a code to find the maximum value in a list of numbers." },
	]
	chat = tokenizer.apply_chat_template(chat, tokenize=False, add_generation_prompt=True)
	# tokenize the text
	input_tokens = tokenizer(chat, return_tensors="pt")
	# generate output tokens
	output = model.generate(**input_tokens, max_new_tokens=100)
	# decode output tokens into text
	output = tokenizer.batch_decode(output)
	# loop over the batch to print, in this example the batch size is 1
	for i in output:
	print(i)