MohammadKhosravi
/

llama-3-8b-Instruct-bnb-4bit-from-scratch-Galilo-V.1.4.0

PEFT

TensorBoard

Safetensors

trl

sft

unsloth

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

llama-3-8b-Instruct-bnb-4bit-from-scratch-Galilo-V.1.4.0 / config.json

MohammadKhosravi

End of training

916987f verified 5 months ago

raw

history blame

193 Bytes

{"architectures": ["LLaMAModel"], "hidden_size": 4096, "intermediate_size": 11008, "num_attention_heads": 32, "num_hidden_layers": 28, "vocab_size": 32000, "pad_token_id": 0, "eos_token_id": 2}