line-corporation
/

sacpo

Reinforcement Learning

text-generation

reinforcement-learning-from-human-feedback

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Commit History

Update README.md

b596248
verified

akifumiwachi commited on Jun 21

Update README.md

15ddeb1
verified

reisato80 commited on Jun 19

Upload LlamaForCausalLM

06ea01f
verified

reisato80 commited on Jun 19

Upload tokenizer

e8f6e19
verified

reisato80 commited on Jun 19

Create README.md

c4c56bb
verified

reisato80 commited on Jun 19

initial commit

221953a
verified

ospo-line commited on Jun 11