ggml-org
/

Meta-Llama-3.1-8B-Instruct-Q4_0-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Meta-Llama-3.1-8B-Instruct-Q4_0-GGUF

Commit History

q4_0 : match AWQ format (F16 input / output tensors)

0aba27d
verified

ggerganov commited on Sep 2, 2024

readme : switch to ggml-org

5122d22
verified

ggerganov commited on Aug 15, 2024

Upload README.md with huggingface_hub

16cfec7
verified

ggerganov commited on Aug 14, 2024

Upload imatrix.dat with huggingface_hub

90eac98
verified

ggerganov commited on Aug 14, 2024

Upload meta-llama-3.1-8b-instruct-q4_0.gguf with huggingface_hub

83066b0
verified

ggerganov commited on Aug 14, 2024

initial commit

8c91c31
verified

ggerganov commited on Aug 14, 2024