Upload 11 files

Browse files

Files changed (11) hide show

config.json +154 -155
generation_config.json +14 -22
model.safetensors +2 -2
optimizer.pt +2 -2
rng_state.pth +1 -1
scheduler.pt +1 -1
special_tokens_map.json +49 -7
tokenizer.json +2 -2
tokenizer_config.json +78 -667
trainer_state.json +155 -209
training_args.bin +3 -0

config.json CHANGED Viewed

@@ -1,155 +1,154 @@
-{
-  "_name_or_path": "ayjays132/CustomGPT2Conversational",
-  "activation_function": "gelu_new",
-  "advanced_model_options": {
-    "contextual_embeddings": {
-      "approaches": [
-        "contextual_attention_mechanisms",
-        "semantic_embedding_regularization"
-      ],
-      "enable": true
-    },
-    "dynamic_adaptation": {
-      "enable": true,
-      "techniques": [
-        "adaptive_layer_dropping",
-        "dynamic_context_window"
-      ]
-    },
-    "innovative_neuron_growth": {
-      "enable": true,
-      "strategies": [
-        "selective_neuron_pruning",
-        "progressive_neuron_expansion"
-      ]
-    },
-    "memory_optimization": {
-      "enable": true,
-      "methods": [
-        "gradient_checkpointing",
-        "memory-efficient_attention"
-      ]
-    },
-    "meta_learning": {
-      "approaches": [
-        "meta_learning_rate_adjustment",
-        "online_adaptation"
-      ],
-      "enable": true
-    },
-    "secret_advanced_options": {
-      "adaptive_token_embedding": {
-        "enable": true,
-        "strategies": [
-          "dynamic_embedding_resizing",
-          "contextual_embedding_scaling"
-        ]
-      },
-      "future_context_prediction": {
-        "enable": true,
-        "techniques": [
-          "lookahead_context_integration",
-          "predictive_attention_mechanisms"
-        ]
-      },
-      "multi_modal_integration": {
-        "enable": true,
-        "methods": [
-          "text_image_alignment",
-          "cross_modal_attention"
-        ]
-      }
-    }
-  },
-  "architectures": [
-    "GPT2LMHeadModel"
-  ],
-  "max_length": 512,
-  "min_length": 50,
-  "num_beams": 5,
-  "length_penalty": 1.0,
-  "no_repeat_ngram_size": 2,
-  "early_stopping": true,
-  "attn_pdrop": 0.1,
-  "bos_token_id": 50256,
-  "context_window": 20,
-  "contextual_embedding_dim": 1024,
-  "device": "cuda",
-  "dropout_rate": 0.1,
-  "embd_pdrop": 0.1,
-  "embedding_dim": 1024,
-  "eos_token_id": 50256,
-  "hidden_dim": 1024,
-  "initializer_range": 0.02,
-  "innovative_growth_capacity": 50000,
-  "integration_settings": {
-    "config_name": "config.json",
-    "load_from_transformers": true,
-    "pytorch_dump_folder_path": "./model_save",
-    "pytorch_model_bin_name": "pytorch_model.bin"
-  },
-  "layer_norm_epsilon": 1e-05,
-  "max_memory_size": 100000,
-  "max_neurons": 100,
-  "meta_learning_rate": 0.001,
-  "model_type": "gpt2",
-  "n_ctx": 1024,
-  "n_embd": 1024,
-  "n_head": 16,
-  "n_inner": null,
-  "n_layer": 24,
-  "n_positions": 1024,
-  "num_embeddings": 50268,
-  "num_heads": 64,
-  "num_layers": 24,
-  "output_attentions": true,
-  "output_hidden_states": true,
-  "pad_token_id": 50256,
-  "reorder_and_upcast_attn": false,
-  "resid_pdrop": 0.1,
-  "scale_attn_by_inverse_layer_idx": false,
-  "scale_attn_weights": true,
-  "sep_token_id": -1,
-  "special_tokens": {
-    "additional_special_tokens": [
-      "<greeting>",
-      "<farewell>",
-      "<thank>",
-      "<apology>"
-    ],
-    "bos_token": "<bos>",
-    "cls_token": "<cls>",
-    "eos_token": "<eos>",
-    "mask_token": "<mask>",
-    "pad_token": "<pad>",
-    "sep_token": "<sep>",
-    "unk_token": "<unk>"
-  },
-  "state_shape": null,
-  "summary_activation": null,
-  "summary_first_dropout": 0.1,
-  "summary_proj_to_labels": true,
-  "summary_type": "cls_index",
-  "summary_use_proj": true,
-  "target_q_model": null,
-  "task_specific_params": {
-    "text-generation": {
-      "do_sample": true,
-      "early_stopping": true,
-      "length_penalty": 1.0,
-      "max_length": 2048,
-      "min_length": 64,
-      "no_repeat_ngram_size": 2,
-      "num_beams": 8,
-      "num_return_sequences": 3,
-      "repetition_penalty": 1.2,
-      "temperature": 0.9,
-      "top_k": 50,
-      "top_p": 0.95
-    }
-  },
-  "torch_dtype": "float32",
-  "transformers_version": "4.28.0.dev0",
-  "use_cache": true,
-  "vocab_size": 50257
-}

+{
+  "_name_or_path": "ayjays132/CustomGPT2Conversational",
+  "activation_function": "gelu_new",
+  "advanced_model_options": {
+    "contextual_embeddings": {
+      "approaches": [
+        "contextual_attention_mechanisms",
+        "semantic_embedding_regularization"
+      ],
+      "enable": true
+    },
+    "dynamic_adaptation": {
+      "enable": true,
+      "techniques": [
+        "adaptive_layer_dropping",
+        "dynamic_context_window"
+      ]
+    },
+    "innovative_neuron_growth": {
+      "enable": true,
+      "strategies": [
+        "selective_neuron_pruning",
+        "progressive_neuron_expansion"
+      ]
+    },
+    "memory_optimization": {
+      "enable": true,
+      "methods": [
+        "gradient_checkpointing",
+        "memory-efficient_attention"
+      ]
+    },
+    "meta_learning": {
+      "approaches": [
+        "meta_learning_rate_adjustment",
+        "online_adaptation"
+      ],
+      "enable": true
+    },
+    "secret_advanced_options": {
+      "adaptive_token_embedding": {
+        "enable": true,
+        "strategies": [
+          "dynamic_embedding_resizing",
+          "contextual_embedding_scaling"
+        ]
+      },
+      "future_context_prediction": {
+        "enable": true,
+        "techniques": [
+          "lookahead_context_integration",
+          "predictive_attention_mechanisms"
+        ]
+      },
+      "multi_modal_integration": {
+        "enable": true,
+        "methods": [
+          "text_image_alignment",
+          "cross_modal_attention"
+        ]
+      }
+    }
+  },
+  "architectures": [
+    "GPT2LMHeadModel"
+  ],
+  "attn_pdrop": 0.1,
+  "bos_token_id": 50256,
+  "context_window": 20,
+  "contextual_embedding_dim": 1024,
+  "device": "cuda",
+  "dropout_rate": 0.1,
+  "early_stopping": true,
+  "embd_pdrop": 0.1,
+  "embedding_dim": 1024,
+  "eos_token_id": 50256,
+  "hidden_dim": 1024,
+  "initializer_range": 0.02,
+  "innovative_growth_capacity": 50000,
+  "integration_settings": {
+    "config_name": "config.json",
+    "load_from_transformers": true,
+    "pytorch_dump_folder_path": "./model_save",
+    "pytorch_model_bin_name": "pytorch_model.bin"
+  },
+  "layer_norm_epsilon": 1e-05,
+  "max_length": 512,
+  "max_memory_size": 100000,
+  "max_neurons": 100,
+  "meta_learning_rate": 0.001,
+  "min_length": 50,
+  "model_type": "gpt2",
+  "n_ctx": 1024,
+  "n_embd": 1024,
+  "n_head": 16,
+  "n_inner": null,
+  "n_layer": 24,
+  "n_positions": 1024,
+  "no_repeat_ngram_size": 2,
+  "num_beams": 5,
+  "num_embeddings": 50268,
+  "num_heads": 64,
+  "num_layers": 24,
+  "output_attentions": true,
+  "output_hidden_states": true,
+  "pad_token_id": 50256,
+  "reorder_and_upcast_attn": false,
+  "resid_pdrop": 0.1,
+  "scale_attn_by_inverse_layer_idx": false,
+  "scale_attn_weights": true,
+  "sep_token_id": -1,
+  "special_tokens": {
+    "additional_special_tokens": [
+      "<greeting>",
+      "<farewell>",
+      "<thank>",
+      "<apology>"
+    ],
+    "bos_token": "<bos>",
+    "cls_token": "<cls>",
+    "eos_token": "<eos>",
+    "mask_token": "<mask>",
+    "pad_token": "<pad>",
+    "sep_token": "<sep>",
+    "unk_token": "<unk>"
+  },
+  "state_shape": null,
+  "summary_activation": null,
+  "summary_first_dropout": 0.1,
+  "summary_proj_to_labels": true,
+  "summary_type": "cls_index",
+  "summary_use_proj": true,
+  "target_q_model": null,
+  "task_specific_params": {
+    "text-generation": {
+      "do_sample": true,
+      "early_stopping": true,
+      "length_penalty": 1.0,
+      "max_length": 2048,
+      "min_length": 64,
+      "no_repeat_ngram_size": 2,
+      "num_beams": 8,
+      "num_return_sequences": 3,
+      "repetition_penalty": 1.2,
+      "temperature": 0.9,
+      "top_k": 50,
+      "top_p": 0.95
+    }
+  },
+  "torch_dtype": "float32",
+  "transformers_version": "4.44.0",
+  "use_cache": true,
+  "vocab_size": 50257
+}

generation_config.json CHANGED Viewed

@@ -1,22 +1,14 @@
-{
-  "_from_model_config": true,
-  "bos_token_id": 50258,
-  "diversity_penalty": 1.0,  // Increased to encourage diversity
-  "do_sample": true,
-  "early_stopping": false,
-  "encoder_no_repeat_ngram_size": 3,
-  "eos_token_id": 50259,
-  "length_penalty": 2.0,
-  "max_length": 2048,
-  "min_length": 50,
-  "no_repeat_ngram_size": 3,
-  "num_beams": 3,  // Decreased to encourage more variety
-  "num_return_sequences": 5,
-  "output_attentions": false,
-  "output_hidden_states": false,
-  "pad_token_id": 50260,
-  "repetition_penalty": 1.2,  // Slightly reduced to balance repetition
-  "temperature": 0.8,  // Increased for more variety
-  "top_p": 0.85,  // Adjusted to change the sampling method
-  "transformers_version": "4.28.0.dev0"
-}

+{
+  "_from_model_config": true,
+  "bos_token_id": 50256,
+  "early_stopping": true,
+  "eos_token_id": 50256,
+  "max_length": 512,
+  "min_length": 50,
+  "no_repeat_ngram_size": 2,
+  "num_beams": 5,
+  "output_attentions": true,
+  "output_hidden_states": true,
+  "pad_token_id": 50256,
+  "transformers_version": "4.44.0"
+}

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dfbfe49a0df1bf0c68b96e533cfcac9860d224e6cd93987cefd99755aeed9293
-size 1650346720

 version https://git-lfs.github.com/spec/v1
+oid sha256:bedad08b6a15276b927bbfe52f63c93bd8de121c0ed283143f52cb05a4034952
+size 1419322880

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ab539d99a780743646d9a767aa02600e44b3d55247a9d2645ddfbe5ddac77d90
-size 7950060608

 version https://git-lfs.github.com/spec/v1
+oid sha256:ec8bbad0dfcf56ce50d8403fead5d33759f8377b4ecc3586d48e4f70e1fa7130
+size 2838829242

rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e01b7f87643c2c0e2c54e0176baa248efa5b4d899d20eb6dccb59d8207cd98d
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:8346bdbc56406753b30e03fb8823387b71174c06848cd07d3ae27967e07a1236
 size 14244

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e7a322f5bf45f9f9b8ad8738431158838d76971e674aed83470f4b2485f7b2d6
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:5fd77b5f09d2be234b9c114ec17c3402cfa26c5f985967d53d9ecd811d60c62d
 size 1064

special_tokens_map.json CHANGED Viewed

@@ -1,9 +1,51 @@
 {
-  "bos_token": "[BOS]",
-  "cls_token": "[CLS]",
-  "eos_token": "[EOS]",
-  "mask_token": "[MASK]",
-  "pad_token": "[UNK]",
-  "sep_token": "[SEP]",
-  "unk_token": "[UNK]"
 }

 {
+  "bos_token": {
+    "content": "[BOS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "cls_token": {
+    "content": "[CLS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "eos_token": {
+    "content": "[EOS]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "mask_token": {
+    "content": "[MASK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "pad_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "sep_token": {
+    "content": "[SEP]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  },
+  "unk_token": {
+    "content": "[UNK]",
+    "lstrip": false,
+    "normalized": false,
+    "rstrip": false,
+    "single_word": false
+  }
 }

tokenizer.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e1c20b7a90d2b5bd165c0532f7f94a9f412f47fe9fca3bb900b0a9cfd95365d1
-size 2114555

 version https://git-lfs.github.com/spec/v1
+oid sha256:4c96bac1238975e345e9433da7045e227abfa9551536c55b7e5caa292114893c
+size 2217058

tokenizer_config.json CHANGED Viewed

@@ -1,667 +1,78 @@
-{
-  "add_prefix_space": false,
-  "added_tokens_decoder": {
-    "11274": {
-      "content": "good",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "26209": {
-      "content": "response",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "34191": {
-      "content": "happy",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "38986": {
-      "content": "environment",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50256": {
-      "content": "",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50257": {
-      "content": "",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50258": {
-      "content": "<bos>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50259": {
-      "content": "<eos>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50260": {
-      "content": "<pad>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50261": {
-      "content": "<unk>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50262": {
-      "content": "<sep>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50263": {
-      "content": "<cls>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50264": {
-      "content": "<mask>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50265": {
-      "content": "<greeting>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50266": {
-      "content": "<farewell>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50267": {
-      "content": "<thank>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50268": {
-      "content": "<apology>",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50269": {
-      "content": "[PAD]",
-      "lstrip": false,
-      "normalized": false,
-      "rstrip": false,
-      "single_word": false,
-      "special": true
-    },
-    "50270": {
-      "content": "intelligent",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50271": {
-      "content": "amazeballs",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50272": {
-      "content": "cryptocurrency",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50273": {
-      "content": "webinar",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50274": {
-      "content": "vlog",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50275": {
-      "content": "upcycle",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50276": {
-      "content": "photobomb",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50277": {
-      "content": "facepalm",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50278": {
-      "content": "crowdfunding",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50279": {
-      "content": "bromance",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50280": {
-      "content": "hangry",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50281": {
-      "content": "empathy",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50282": {
-      "content": "active_listening",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50283": {
-      "content": "open_ended_question",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50284": {
-      "content": "reflective_summary",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50285": {
-      "content": "active_listener",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50286": {
-      "content": "emotional_intelligence",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50287": {
-      "content": "interpersonal_skill",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50288": {
-      "content": "non_verbal_cue",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50289": {
-      "content": "personal_boundaries",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50290": {
-      "content": "active_listener",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50291": {
-      "content": "non_judgmental",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50292": {
-      "content": "cultural_sensitivity",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50293": {
-      "content": "emotional_regulation",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50294": {
-      "content": "self_awareness",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50295": {
-      "content": "social_skill",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50296": {
-      "content": "communication_style",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50297": {
-      "content": "conversational_skill",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50298": {
-      "content": "emotional_literacy",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50299": {
-      "content": "interpersonal_communication",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50300": {
-      "content": "resilience",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50301": {
-      "content": "stress_management",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50302": {
-      "content": "self_management",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50303": {
-      "content": "self_efficacy",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50304": {
-      "content": "self_motivation",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50305": {
-      "content": "self_control",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50306": {
-      "content": "self_esteem",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50307": {
-      "content": "emotional_balance",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50308": {
-      "content": "stress_reduction",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50309": {
-      "content": "goal_setting",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50310": {
-      "content": "time_management",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50311": {
-      "content": "organization_skill",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50312": {
-      "content": "self_directed_learning",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50313": {
-      "content": "self_reflection",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50314": {
-      "content": "empathy_map",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50315": {
-      "content": "interpersonal_relationship",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50316": {
-      "content": "personal_growth",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50317": {
-      "content": "personal_development",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50318": {
-      "content": "mindfulness",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50319": {
-      "content": "personal_well_being",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50320": {
-      "content": "personal_resilience",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50321": {
-      "content": "self_care",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50322": {
-      "content": "self_improvement",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50323": {
-      "content": "personal_growth_plan",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50324": {
-      "content": "life_skill",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50325": {
-      "content": "self_renewal",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    },
-    "50326": {
-      "content": "self_growth",
-      "lstrip": false,
-      "normalized": true,
-      "rstrip": false,
-      "single_word": false,
-      "special": false
-    }
-  },
-  "additional_special_tokens": [
-    "<greeting>",
-    "<farewell>",
-    "<thank>",
-    "<apology>"
-  ],
-  "additional_vocab_files": {
-    "bpe_merges_file": "merges.txt",
-    "bpe_vocab_file": "vocab.json"
-  },
-  "advanced_options": {
-    "dynamic_padding": true,
-    "language_model_integration": {
-      "enable": true,
-      "models": [
-        "bert-base-uncased",
-        "roberta-base"
-      ]
-    },
-    "lexical_analysis": {
-      "enable": true,
-      "methods": [
-        "morphological",
-        "syntactic",
-        "semantic"
-      ]
-    },
-    "subword_regularization": {
-      "enable": true,
-      "techniques": [
-        "sampling",
-        "dropping"
-      ]
-    }
-  },
-  "bos_token": "<bos>",
-  "bpe_dropout": 0.1,
-  "clean_up_tokenization_spaces": true,
-  "cls_token": "<cls>",
-  "do_lower_case": false,
-  "enable_sentencepiece": true,
-  "eos_token": "<eos>",
-  "interleaved_tokenization": true,
-  "mask_token": "<mask>",
-  "max_length": 1024,
-  "model_max_length": 1024,
-  "pad_to_multiple_of": null,
-  "pad_token": "<pad>",
-  "pad_token_type_id": 0,
-  "padding_side": "right",
-  "sentence_piece_model_path": "spiece.model",
-  "sep_token": "<sep>",
-  "special_tokens_map_file": "special_tokens_map.json",
-  "stride": 0,
-  "strip_accents": null,
-  "tokenizer_class": "GPT2Tokenizer",
-  "truncation_side": "right",
-  "truncation_strategy": "longest_first",
-  "unk_token": "<unk>",
-  "use_auth_token": true,
-  "use_fast_tokenizer": true,
-  "wordpieces_prefix": "##"
-}

+{
+  "added_tokens_decoder": {
+    "0": {
+      "content": "[PAD]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "1": {
+      "content": "[UNK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "2": {
+      "content": "[CLS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "3": {
+      "content": "[SEP]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "4": {
+      "content": "[MASK]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "5": {
+      "content": "[BOS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "6": {
+      "content": "[EOS]",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "bos_token": "[BOS]",
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "eos_token": "[EOS]",
+  "mask_token": "[MASK]",
+  "max_length": 1024,
+  "model_max_length": 1024,
+  "pad_to_multiple_of": null,
+  "pad_token": "[UNK]",
+  "pad_token_type_id": 0,
+  "padding": "max_length",
+  "padding_side": "right",
+  "sep_token": "[SEP]",
+  "stride": 0,
+  "tokenizer_class": "PreTrainedTokenizerFast",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
+  "unk_token": "[UNK]"
+}

trainer_state.json CHANGED Viewed

@@ -1,209 +1,155 @@
-{
-  "best_metric": null,
-  "best_model_checkpoint": null,
-  "epoch": 0.9995835068721366,
-  "eval_steps": 500,
-  "global_step": 300,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 0.03,
-      "learning_rate": 3.0000000000000004e-07,
-      "loss": 11.1022,
-      "step": 10
-    },
-    {
-      "epoch": 0.07,
-      "learning_rate": 8.000000000000001e-07,
-      "loss": 10.5874,
-      "step": 20
-    },
-    {
-      "epoch": 0.1,
-      "learning_rate": 1.3e-06,
-      "loss": 9.359,
-      "step": 30
-    },
-    {
-      "epoch": 0.13,
-      "learning_rate": 1.8e-06,
-      "loss": 7.4948,
-      "step": 40
-    },
-    {
-      "epoch": 0.17,
-      "learning_rate": 2.3e-06,
-      "loss": 5.7244,
-      "step": 50
-    },
-    {
-      "epoch": 0.2,
-      "learning_rate": 2.8000000000000003e-06,
-      "loss": 4.1675,
-      "step": 60
-    },
-    {
-      "epoch": 0.23,
-      "learning_rate": 3.3e-06,
-      "loss": 3.2211,
-      "step": 70
-    },
-    {
-      "epoch": 0.27,
-      "learning_rate": 3.8e-06,
-      "loss": 2.4147,
-      "step": 80
-    },
-    {
-      "epoch": 0.3,
-      "learning_rate": 4.2999999999999995e-06,
-      "loss": 1.7997,
-      "step": 90
-    },
-    {
-      "epoch": 0.33,
-      "learning_rate": 4.800000000000001e-06,
-      "loss": 1.4401,
-      "step": 100
-    },
-    {
-      "epoch": 0.37,
-      "learning_rate": 5.3e-06,
-      "loss": 1.2247,
-      "step": 110
-    },
-    {
-      "epoch": 0.4,
-      "learning_rate": 5.8e-06,
-      "loss": 1.0594,
-      "step": 120
-    },
-    {
-      "epoch": 0.43,
-      "learning_rate": 6.300000000000001e-06,
-      "loss": 0.9899,
-      "step": 130
-    },
-    {
-      "epoch": 0.47,
-      "learning_rate": 6.800000000000001e-06,
-      "loss": 0.8842,
-      "step": 140
-    },
-    {
-      "epoch": 0.5,
-      "learning_rate": 7.2999999999999996e-06,
-      "loss": 0.8798,
-      "step": 150
-    },
-    {
-      "epoch": 0.53,
-      "learning_rate": 7.8e-06,
-      "loss": 0.8872,
-      "step": 160
-    },
-    {
-      "epoch": 0.57,
-      "learning_rate": 8.3e-06,
-      "loss": 0.8889,
-      "step": 170
-    },
-    {
-      "epoch": 0.6,
-      "learning_rate": 8.8e-06,
-      "loss": 0.9344,
-      "step": 180
-    },
-    {
-      "epoch": 0.63,
-      "learning_rate": 9.3e-06,
-      "loss": 0.9867,
-      "step": 190
-    },
-    {
-      "epoch": 0.67,
-      "learning_rate": 9.800000000000001e-06,
-      "loss": 0.8925,
-      "step": 200
-    },
-    {
-      "epoch": 0.7,
-      "learning_rate": 1.03e-05,
-      "loss": 0.7869,
-      "step": 210
-    },
-    {
-      "epoch": 0.73,
-      "learning_rate": 1.08e-05,
-      "loss": 0.8847,
-      "step": 220
-    },
-    {
-      "epoch": 0.77,
-      "learning_rate": 1.13e-05,
-      "loss": 0.8221,
-      "step": 230
-    },
-    {
-      "epoch": 0.8,
-      "learning_rate": 1.18e-05,
-      "loss": 0.8611,
-      "step": 240
-    },
-    {
-      "epoch": 0.83,
-      "learning_rate": 1.23e-05,
-      "loss": 0.8544,
-      "step": 250
-    },
-    {
-      "epoch": 0.87,
-      "learning_rate": 1.2800000000000001e-05,
-      "loss": 0.8061,
-      "step": 260
-    },
-    {
-      "epoch": 0.9,
-      "learning_rate": 1.3300000000000001e-05,
-      "loss": 0.7984,
-      "step": 270
-    },
-    {
-      "epoch": 0.93,
-      "learning_rate": 1.3800000000000002e-05,
-      "loss": 0.7396,
-      "step": 280
-    },
-    {
-      "epoch": 0.97,
-      "learning_rate": 1.43e-05,
-      "loss": 0.8653,
-      "step": 290
-    },
-    {
-      "epoch": 1.0,
-      "learning_rate": 1.48e-05,
-      "loss": 0.8675,
-      "step": 300
-    },
-    {
-      "epoch": 1.0,
-      "eval_loss": 0.8561133146286011,
-      "eval_runtime": 33.8169,
-      "eval_samples_per_second": 47.343,
-      "eval_steps_per_second": 7.895,
-      "step": 300
-    }
-  ],
-  "logging_steps": 10,
-  "max_steps": 1800,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 6,
-  "save_steps": 500,
-  "total_flos": 3763911720960000.0,
-  "train_batch_size": 6,
-  "trial_name": null,
-  "trial_params": null
-}

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 3.0,
+  "eval_steps": 500,
+  "global_step": 141,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.2127659574468085,
+      "grad_norm": 14.269296646118164,
+      "learning_rate": 4.858156028368794e-05,
+      "loss": 17.1938,
+      "step": 10
+    },
+    {
+      "epoch": 0.425531914893617,
+      "grad_norm": 6.576030254364014,
+      "learning_rate": 4.50354609929078e-05,
+      "loss": 8.7349,
+      "step": 20
+    },
+    {
+      "epoch": 0.6382978723404256,
+      "grad_norm": 9.514806747436523,
+      "learning_rate": 4.148936170212766e-05,
+      "loss": 7.7678,
+      "step": 30
+    },
+    {
+      "epoch": 0.851063829787234,
+      "grad_norm": 9.582891464233398,
+      "learning_rate": 3.794326241134752e-05,
+      "loss": 7.0878,
+      "step": 40
+    },
+    {
+      "epoch": 1.0,
+      "eval_loss": 6.37921142578125,
+      "eval_runtime": 5.6868,
+      "eval_samples_per_second": 7.386,
+      "eval_steps_per_second": 1.934,
+      "step": 47
+    },
+    {
+      "epoch": 1.0638297872340425,
+      "grad_norm": 12.990375518798828,
+      "learning_rate": 3.4397163120567377e-05,
+      "loss": 6.86,
+      "step": 50
+    },
+    {
+      "epoch": 1.2765957446808511,
+      "grad_norm": 12.003615379333496,
+      "learning_rate": 3.085106382978723e-05,
+      "loss": 6.5234,
+      "step": 60
+    },
+    {
+      "epoch": 1.4893617021276595,
+      "grad_norm": 14.846796989440918,
+      "learning_rate": 2.7304964539007094e-05,
+      "loss": 6.2994,
+      "step": 70
+    },
+    {
+      "epoch": 1.702127659574468,
+      "grad_norm": 15.324792861938477,
+      "learning_rate": 2.3758865248226954e-05,
+      "loss": 6.1691,
+      "step": 80
+    },
+    {
+      "epoch": 1.9148936170212765,
+      "grad_norm": 11.699965476989746,
+      "learning_rate": 2.0212765957446807e-05,
+      "loss": 6.1812,
+      "step": 90
+    },
+    {
+      "epoch": 2.0,
+      "eval_loss": 5.777428150177002,
+      "eval_runtime": 6.2453,
+      "eval_samples_per_second": 6.725,
+      "eval_steps_per_second": 1.761,
+      "step": 94
+    },
+    {
+      "epoch": 2.127659574468085,
+      "grad_norm": 13.892985343933105,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 6.0102,
+      "step": 100
+    },
+    {
+      "epoch": 2.3404255319148937,
+      "grad_norm": 15.94567584991455,
+      "learning_rate": 1.3120567375886524e-05,
+      "loss": 5.9313,
+      "step": 110
+    },
+    {
+      "epoch": 2.5531914893617023,
+      "grad_norm": 10.468910217285156,
+      "learning_rate": 9.574468085106383e-06,
+      "loss": 6.013,
+      "step": 120
+    },
+    {
+      "epoch": 2.7659574468085104,
+      "grad_norm": 10.299534797668457,
+      "learning_rate": 6.028368794326241e-06,
+      "loss": 5.9602,
+      "step": 130
+    },
+    {
+      "epoch": 2.978723404255319,
+      "grad_norm": 12.492215156555176,
+      "learning_rate": 2.4822695035460995e-06,
+      "loss": 5.8626,
+      "step": 140
+    },
+    {
+      "epoch": 3.0,
+      "eval_loss": 5.686648845672607,
+      "eval_runtime": 6.8751,
+      "eval_samples_per_second": 6.109,
+      "eval_steps_per_second": 1.6,
+      "step": 141
+    }
+  ],
+  "logging_steps": 10,
+  "max_steps": 141,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 3,
+  "save_steps": 500,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 1047574383427584.0,
+  "train_batch_size": 4,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4a6300bd64a2133832e68dd195890f548ec75ffbdaa6208036f80c4a9b9edd6a
+size 5112