REILX commited on
Commit
14c06a5
1 Parent(s): 890d014

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +32 -1
README.md CHANGED
@@ -26,6 +26,7 @@ https://huggingface.co/Qwen/Qwen2-7B-Instruct
26
  1. REILX/neo_sft_phase2_conversations
27
  2. REILX/neo_sft_phase2_multi
28
  3. REILX/neo_sft_phase2_single
 
29
 
30
  ### 数据集构建规则
31
 
@@ -56,6 +57,15 @@ https://huggingface.co/Qwen/Qwen2-7B-Instruct
56
  4. 将该“conversation”的“gpt”的“value”作为“output”。
57
  5. “input”可为空白,亦可注入适当的提示信息。
58
 
 
 
 
 
 
 
 
 
 
59
 
60
  ### 训练参数
61
  REILX/neo_sft_phase2_conversations</br>
@@ -106,6 +116,23 @@ REILX/neo_sft_phase2_single</br>
106
  - lr_scheduler_warmup_ratio: 0.1
107
  - num_epochs: 5.0
108
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
109
  ### 损失图
110
  REILX/neo_sft_phase2_conversations</br>
111
  <!-- ![neo_sft_phase2_conversations_loss](./neo_sft_phase2_conversations/training_loss.png) -->
@@ -117,4 +144,8 @@ REILX/neo_sft_phase2_multi</br>
117
 
118
  REILX/neo_sft_phase2_single</br>
119
  <!-- ![neo_sft_phase2_single_loss](./neo_sft_phase2_single/training_loss.png) -->
120
- <img src="./neo_sft_phase2_single/training_loss.png" alt="neo_sft_phase2_single_loss" width="60%">
 
 
 
 
 
26
  1. REILX/neo_sft_phase2_conversations
27
  2. REILX/neo_sft_phase2_multi
28
  3. REILX/neo_sft_phase2_single
29
+ 4. REILX/neo_sft_phase2_all_pair
30
 
31
  ### 数据集构建规则
32
 
 
57
  4. 将该“conversation”的“gpt”的“value”作为“output”。
58
  5. “input”可为空白,亦可注入适当的提示信息。
59
 
60
+ **REILX/neo_sft_phase2_all_pair**
61
+
62
+ * **具体步骤:**
63
+ 1. 输入为一个json文件,遍历每一个conversations
64
+ 2. conversations包含多轮对话,需要按照对应的轮数构成新数据集
65
+ 3. 比如1、2轮构成一个jsonl的一行,3、4构成一行,5、6构成一行等等等,直到完整的使用结束conversations
66
+ 4. 将该“conversation”的“human”的“value”作为“instruction”
67
+ 5. 将该“conversation”的“gpt”的“value”作为“output”
68
+ 4. “input”可为空白,亦可注入适当的提示信息。
69
 
70
  ### 训练参数
71
  REILX/neo_sft_phase2_conversations</br>
 
116
  - lr_scheduler_warmup_ratio: 0.1
117
  - num_epochs: 5.0
118
 
119
+ REILX/neo_sft_phase2_all_pair</br>
120
+ - learning_rate: 2e-05
121
+ - train_batch_size: 1
122
+ - eval_batch_size: 8
123
+ - cutoff_len:4096
124
+ - seed: 42
125
+ - distributed_type: multi-GPU
126
+ - num_devices: 8
127
+ - gradient_accumulation_steps: 8
128
+ - total_train_batch_size: 64
129
+ - total_eval_batch_size: 64
130
+ - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
131
+ - lr_scheduler_type: cosine
132
+ - lr_scheduler_warmup_ratio: 0.1
133
+ - num_epochs: 5.0
134
+
135
+
136
  ### 损失图
137
  REILX/neo_sft_phase2_conversations</br>
138
  <!-- ![neo_sft_phase2_conversations_loss](./neo_sft_phase2_conversations/training_loss.png) -->
 
144
 
145
  REILX/neo_sft_phase2_single</br>
146
  <!-- ![neo_sft_phase2_single_loss](./neo_sft_phase2_single/training_loss.png) -->
147
+ <img src="./neo_sft_phase2_single/training_loss.png" alt="neo_sft_phase2_single_loss" width="60%">
148
+
149
+ REILX/neo_sft_phase2_all_pair</br>
150
+ <!-- ![neo_sft_phase2_single_loss](./neo_sft_phase2_single/training_loss.png) -->
151
+ <img src="./neo_sft_phase2_all_pair/training_loss.png" alt="neo_sft_phase2_all_pair_loss" width="60%">