rinna
/

bilingual-gpt-neox-4b

Text Generation

text-generation-inference

Model card Files Files and versions Community

tianyuz commited on Aug 2, 2023

Commit

fb6e99b

•

1 Parent(s): 9f59c67

Update README.md

Files changed (1) hide show

README.md +4 -2

README.md CHANGED Viewed

@@ -43,6 +43,7 @@ This repository provides an English-Japanese bilingual GPT-NeoX model of 3.8 bil
     | Variant | Link |
     | :-- | :--|
     | Bilingual 4B MiniGPT4 | https://huggingface.co/rinna/bilingual-gpt-neox-4b-minigpt4 |
     | Bilingual 4B SFT | https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-sft |
     | Bilingual 4B 8K | https://huggingface.co/rinna/bilingual-gpt-neox-4b-8k |
     | Bilingual 4B | https://huggingface.co/rinna/bilingual-gpt-neox-4b |
@@ -67,11 +68,12 @@ This repository provides an English-Japanese bilingual GPT-NeoX model of 3.8 bil
     | Model | 4-task average accuracy | 6-task average accuracy |
     | :-- | :-- | :-- |
-    | bilingual-gpt-neox-4b-instruction-sft | 59.25 | 60.59 |
     | **bilingual-gpt-neox-4b** | **56.12** | **51.83** |
     | japanese-gpt-neox-3.6b-instruction-ppo | 59.86 | 60.07 |
     | japanese-gpt-neox-3.6b | 55.07 | 50.32 |
 * **English benchmark**
   Using the [EleutherAI Language Model Evaluation Harness](https://github.com/EleutherAI/lm-evaluation-harness/tree/master), we found the bilingual-gpt-neox-4b performs comparably with English/multilingual models of similar sizes.

     | Variant | Link |
     | :-- | :--|
     | Bilingual 4B MiniGPT4 | https://huggingface.co/rinna/bilingual-gpt-neox-4b-minigpt4 |
+    | Bilingual 4B PPO | https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-ppo |
     | Bilingual 4B SFT | https://huggingface.co/rinna/bilingual-gpt-neox-4b-instruction-sft |
     | Bilingual 4B 8K | https://huggingface.co/rinna/bilingual-gpt-neox-4b-8k |
     | Bilingual 4B | https://huggingface.co/rinna/bilingual-gpt-neox-4b |
     | Model | 4-task average accuracy | 6-task average accuracy |
     | :-- | :-- | :-- |
+    | bilingual-gpt-neox-4b-instruction-ppo | 61.01 | 61.16 |
+    | bilingual-gpt-neox-4b-instruction-sft | 61.02 | 61.69 |
     | **bilingual-gpt-neox-4b** | **56.12** | **51.83** |
     | japanese-gpt-neox-3.6b-instruction-ppo | 59.86 | 60.07 |
     | japanese-gpt-neox-3.6b | 55.07 | 50.32 |
 * **English benchmark**
   Using the [EleutherAI Language Model Evaluation Harness](https://github.com/EleutherAI/lm-evaluation-harness/tree/master), we found the bilingual-gpt-neox-4b performs comparably with English/multilingual models of similar sizes.