jcrkn
/

wav2vec2-large-xls-r-300m-breton-colab_hyper2

Automatic Speech Recognition

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

jcrkn commited on Aug 30, 2023

Commit

7b39843

•

1 Parent(s): 836cc73

Training in progress, step 200

Files changed (3) hide show

config.json +5 -5
pytorch_model.bin +1 -1
training_args.bin +1 -1

config.json CHANGED Viewed

@@ -9,7 +9,7 @@
   "architectures": [
     "Wav2Vec2ForCTC"
   ],
-  "attention_dropout": 0.5,
   "bos_token_id": 1,
   "classifier_proj_size": 256,
   "codevector_dim": 768,
@@ -50,23 +50,23 @@
   "feat_extract_activation": "gelu",
   "feat_extract_dropout": 0.0,
   "feat_extract_norm": "layer",
-  "feat_proj_dropout": 0.5,
   "feat_quantizer_dropout": 0.0,
   "final_dropout": 0.0,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
-  "hidden_dropout": 0.5,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
-  "layerdrop": 0.5,
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
-  "mask_time_prob": 0.5,
   "model_type": "wav2vec2",
   "num_adapter_layers": 3,
   "num_attention_heads": 16,

   "architectures": [
     "Wav2Vec2ForCTC"
   ],
+  "attention_dropout": 0.1,
   "bos_token_id": 1,
   "classifier_proj_size": 256,
   "codevector_dim": 768,
   "feat_extract_activation": "gelu",
   "feat_extract_dropout": 0.0,
   "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.1,
   "feat_quantizer_dropout": 0.0,
   "final_dropout": 0.0,
   "gradient_checkpointing": false,
   "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
   "hidden_size": 1024,
   "initializer_range": 0.02,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
+  "mask_time_prob": 0.1,
   "model_type": "wav2vec2",
   "num_adapter_layers": 3,
   "num_attention_heads": 16,

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:09cec751d92d427d01a7244e2fdfb94085cbb26e667a6691be535e520820264e
 size 1262078125

 version https://git-lfs.github.com/spec/v1
+oid sha256:2e1b72540f9a2e172e39367b0739a029952a34e3d8d3e157557113f229cb3c1f
 size 1262078125

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff3b6244d02e10c1622747e21a44c1b78135b779e1584e1fde30188de459e50a
 size 4091

 version https://git-lfs.github.com/spec/v1
+oid sha256:744685239522a92f2ec327ea24c8e287231e0f2a45228dd000f71a4c57f07b75
 size 4091