OsakanaTeishoku
/

llm-jp-3-13b-instruct2-grpo-0222_step1000_lora-sft

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llm-jp-3-13b-instruct2-grpo-0222_step1000_lora-sft

Commit History

Upload model trained with Unsloth

19aab4f
verified

OsakanaTeishoku commited on 14 days ago

Upload model trained with Unsloth

d5163ce
verified

OsakanaTeishoku commited on 14 days ago

Upload README.md with huggingface_hub

b0bb49f
verified

OsakanaTeishoku commited on 14 days ago

initial commit

0824690
verified

OsakanaTeishoku commited on 14 days ago