sridharps2
/

llama-2-7b-chat-guanaco

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sridharps2 commited on Jan 19

Commit

389cc8c

•

1 Parent(s): e727e1f

Model save

Files changed (1) hide show

README.md +8 -4

README.md CHANGED Viewed

@@ -1,5 +1,8 @@
 ---
 tags:
 - generated_from_trainer
 model-index:
 - name: llama-2-7b-chat-guanaco
@@ -31,14 +34,15 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
-- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 4
-- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - training_steps: 10
 ### Training results
@@ -46,7 +50,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.30.2
 - Pytorch 2.1.0+cu121
 - Datasets 2.16.1
-- Tokenizers 0.13.3

 ---
+base_model: meta-llama/Llama-2-7b-hf
 tags:
+- trl
+- sft
 - generated_from_trainer
 model-index:
 - name: llama-2-7b-chat-guanaco
 The following hyperparameters were used during training:
 - learning_rate: 0.0002
+- train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 4
+- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - training_steps: 10
+- mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- Transformers 4.35.2
 - Pytorch 2.1.0+cu121
 - Datasets 2.16.1
+- Tokenizers 0.15.0