shahules786
/

open-llama-7B-orcastyle

Model card Files Files and versions Community

shahules786 commited on Jul 6, 2023

Commit

64bbc61

·

1 Parent(s): 91dbf0a

Update README.md

Files changed (1) hide show

README.md +13 -1

README.md CHANGED Viewed

@@ -1,10 +1,18 @@
 from peft import PeftModel
 from huggingface_hub import hf_hub_download
 from transformers import LlamaTokenizer, LlamaForCausalLM
 import json
-model_name = "shahules786/open-llama-7B-orcastyle"
 config = hf_hub_download(repo_id=model_name, filename="adapter_config.json", local_dir=".")
 config =  json.load(open("adapter_config.json"))
 base_model = config["base_model_name_or_path"]
@@ -16,3 +24,7 @@ tokenizer.padding_side = "left"
 inputs = tokenizer("This is a sample run", return_tensors="pt")
 model.generate(**inputs)

+## Training details
+- Dataset used: Explanation style datasets from psmathur/WizardLM_Orca and Dahoas/cot_gsm8k
+- Techniques: fp16 bit precision training + LoRA + DeepSpeed
+- Machine: V100 (16GB) * 2
+## Inference
+```python
 from peft import PeftModel
 from huggingface_hub import hf_hub_download
 from transformers import LlamaTokenizer, LlamaForCausalLM
 import json
+model_name = "shahules786/open-llama-3B-orcastyle"
 config = hf_hub_download(repo_id=model_name, filename="adapter_config.json", local_dir=".")
 config =  json.load(open("adapter_config.json"))
 base_model = config["base_model_name_or_path"]
 inputs = tokenizer("This is a sample run", return_tensors="pt")
 model.generate(**inputs)
+```
+Checkout training and inference code [here](https://github.com/explodinggradients/Funtuner/tree/main/funtuner)