Upload LlamaForCausalLM

Files changed (3) hide show

model-00003-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:cea92457065c3cc43771bd38850db5aea667a6fb30a7ca4a3c5c4e3c1fb8697b
-size 5033381704

 version https://git-lfs.github.com/spec/v1
+oid sha256:7d49942a618082108e12263c1e8bc213e65b7114948b5e0ae3768f2fb9e47be6
+size 4915916176

model-00004-of-00004.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5321ca97dd0968a3e2b676b3a42728e9f5327d516bcf0addd4e9cd61c068a1ad
-size 1050673280

 version https://git-lfs.github.com/spec/v1
+oid sha256:92ecfe1a2414458b4821ac8c13cf8cb70aed66b5eea8dc5ad9eeb4ff309d6d7b
+size 1168138808

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "metadata": {
-    "total_size": 15783682048
   },
   "weight_map": {
     "lm_head.weight": "model-00004-of-00004.safetensors",
@@ -230,11 +230,11 @@
     "model.layers.30.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.30.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.30.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
-    "model.layers.31.input_layernorm.weight": "model-00003-of-00004.safetensors",
-    "model.layers.31.mlp.down_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.mlp.gate_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.mlp.up_proj.weight": "model-00003-of-00004.safetensors",
-    "model.layers.31.post_attention_layernorm.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
@@ -293,6 +293,6 @@
     "model.layers.9.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
     "model.layers.9.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
     "model.layers.9.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
-    "model.norm.weight": "model-00003-of-00004.safetensors"
   }
 }

 {
   "metadata": {
+    "total_size": 16060522496
   },
   "weight_map": {
     "lm_head.weight": "model-00004-of-00004.safetensors",
     "model.layers.30.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.30.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.30.self_attn.v_proj.weight": "model-00003-of-00004.safetensors",
+    "model.layers.31.input_layernorm.weight": "model-00004-of-00004.safetensors",
+    "model.layers.31.mlp.down_proj.weight": "model-00004-of-00004.safetensors",
     "model.layers.31.mlp.gate_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.mlp.up_proj.weight": "model-00003-of-00004.safetensors",
+    "model.layers.31.post_attention_layernorm.weight": "model-00004-of-00004.safetensors",
     "model.layers.31.self_attn.k_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.self_attn.o_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.31.self_attn.q_proj.weight": "model-00003-of-00004.safetensors",
     "model.layers.9.self_attn.o_proj.weight": "model-00002-of-00004.safetensors",
     "model.layers.9.self_attn.q_proj.weight": "model-00002-of-00004.safetensors",
     "model.layers.9.self_attn.v_proj.weight": "model-00002-of-00004.safetensors",
+    "model.norm.weight": "model-00004-of-00004.safetensors"
   }
 }