kaist-ai
/

janus-orpo-7b

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Seongyun commited on May 30

Commit

02ec638

•

1 Parent(s): e29438d

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -29,16 +29,16 @@ pipeline_tag: text-generation
 Janus is a model trained using [Mistral-7B-v0.2](https://huggingface.co/mistral-community/Mistral-7B-v0.2) as its base model. Janus has been trained on [Multifaceted Collection](https://huggingface.co/datasets/kaist-ai/Multifaceted-Collection-SFT), a preference dataset containing 196k unique system messages for aligning LLMs to diverse human preferences. Janus not only excels at generating personalized responses that cater to various human preferences but is also adept at producing responses that are generally preferred for being helpful and harmless.
 # Model Details
-Janus-ORPO is a model created by applying ORPO to Mistral-7B-v0.2 using the Multifaceted-Collection-ORPO.
 ## Model Description
 - **Model type:** Language model
 - **Language(s) (NLP):** English
 - **License:** Apache 2.0
-- **Related Models:** [Janus-66k-7B]() [Janus-DPO-7B](), [Janus-7B](), [Janus-RM-7B]()
-- **Training Datasets**: [Multifaceted-Collection-SFT](https://huggingface.co/datasets/kaist-ai/Multifaceted-Collection-SFT)
 - **Resources for more information:**
-  - [Research paper]()
   - [GitHub Repo](https://github.com/kaistAI/Janus)
 # Usage

 Janus is a model trained using [Mistral-7B-v0.2](https://huggingface.co/mistral-community/Mistral-7B-v0.2) as its base model. Janus has been trained on [Multifaceted Collection](https://huggingface.co/datasets/kaist-ai/Multifaceted-Collection-SFT), a preference dataset containing 196k unique system messages for aligning LLMs to diverse human preferences. Janus not only excels at generating personalized responses that cater to various human preferences but is also adept at producing responses that are generally preferred for being helpful and harmless.
 # Model Details
+Janus-ORPO-7B is a model created by applying ORPO to [Mistral-7B-v0.2](https://huggingface.co/mistral-community/Mistral-7B-v0.2) using the [Multifaceted-Collection-ORPO](https://huggingface.co/datasets/kaist-ai/Multifaceted-Collection-ORPO).
 ## Model Description
 - **Model type:** Language model
 - **Language(s) (NLP):** English
 - **License:** Apache 2.0
+- **Related Models:** [Janus-DPO-7B](https://huggingface.co/kaist-ai/janus-dpo-7b), [Janus-7B](https://huggingface.co/kaist-ai/janus-7b), [Janus-RM-7B](https://huggingface.co/kaist-ai/janus-rm-7b)
+- **Training Datasets**: [Multifaceted-Collection-ORPO](https://huggingface.co/datasets/kaist-ai/Multifaceted-Collection-ORPO)
 - **Resources for more information:**
+  - [Research paper](https://arxiv.org/abs/2405.17977)
   - [GitHub Repo](https://github.com/kaistAI/Janus)
 # Usage