neuralmagic
/

Meta-Llama-3.1-8B-quantized.w8a8

Text Generation

8-bit precision

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-quantized.w8a8

Commit History

Update README.md

ee0babf
verified

alexmarques commited on Oct 23, 2024

Update README.md

3244507
verified

alexmarques commited on Oct 23, 2024

Updated compression_config to quantization_config

25b1dc9
verified

mgoin commited on Oct 9, 2024

Update README.md

f2a9838
verified

alexmarques commited on Aug 21, 2024

Update README.md

043563b
verified

alexmarques commited on Aug 21, 2024

Update README.md

82e54a3
verified

alexmarques commited on Aug 21, 2024

Update README.md

be254c0
verified

alexmarques commited on Aug 13, 2024

Create README.md

1eed01c
verified

alexmarques commited on Jul 31, 2024

Upload folder using huggingface_hub

faa056e
verified

alexmarques commited on Jul 31, 2024

initial commit

8604987
verified

alexmarques commited on Jul 31, 2024