rwitz
/

cat1.0

rwitz commited on Nov 9, 2024

Commit

c87cebd

unverified ·

1 Parent(s): ead8392

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -19,9 +19,13 @@ This repository provides a fine-tuned version of the **Llama-3-1-8b base model**
 - **Parameters**: 8 Billion (8B)
 - **Precision**: bf16 (Brain Floating Point 16-bit)
 - **Fine-Tuning Method**: LoRa (Low-Rank Adaptation)
 - **Datasets Used**:
-  - Roleplay Dataset
-  - Reasoning and Logic Dataset
 - **Fine-Tuning Approach**: Iterative Fine-Tuning using self-chat logs
 ## Recommended Settings

 - **Parameters**: 8 Billion (8B)
 - **Precision**: bf16 (Brain Floating Point 16-bit)
 - **Fine-Tuning Method**: LoRa (Low-Rank Adaptation)
+- **Lora Rank**: 32
+- **Lora Alpha**: 64
+- **Learning Rate**: 0.0008
+- **Training Epochs**: 4
 - **Datasets Used**:
+  - cat1.0 Roleplay Dataset
+  - cat1.0 Reasoning and Logic Dataset
 - **Fine-Tuning Approach**: Iterative Fine-Tuning using self-chat logs
 ## Recommended Settings