rhysjones
/

phi-2-orange

Text Generation

Inference Endpoints

Model card Files Files and versions Community

rhysjones commited on Jan 8

Commit

b182c14

•

1 Parent(s): a3714e0

Update README.md

Files changed (1) hide show

README.md +23 -0

README.md CHANGED Viewed

@@ -1,3 +1,26 @@
 ---
 license: mit
 ---

 ---
 license: mit
 ---
+# Phi-2 Orange
+A two-step finetune of Phi-2.
+First using a collection of broad training data:
+- [Open-Orca/SlimOrca-Dedup](https://huggingface.co/datasets/Open-Orca/SlimOrca-Dedup)
+- [migtissera/Synthia-v1.3](https://huggingface.co/datasets/migtissera/Synthia-v1.3)
+- [LDJnr/Verified-Camel](https://huggingface.co/datasets/LDJnr/Verified-Camel)
+- [LDJnr/Pure-Dove](https://huggingface.co/datasets/LDJnr/Pure-Dove)
+- [LDJnr/Capybara](https://huggingface.co/datasets/LDJnr/Capybara)
+- [meta-math/MetaMathQA](https://huggingface.co/datasets/meta-math/MetaMathQA)
+And then a DPO finetune using:
+- [Intel/orca_dpo_pairs](https://huggingface.co/datasets/Intel/orca_dpo_pairs)
+- [argilla/ultrafeedback-binarized-preferences-cleaned](https://huggingface.co/datasets/argilla/ultrafeedback-binarized-preferences-cleaned)
+# Initial Evals
+- ARC: 62.29
+- TruthfulQA: 49.85