neuralmagic
/

Qwen2-1.5B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Qwen2-1.5B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

28f339d
verified

mgoin commited on 10 days ago

Update README.md

3a444bb
verified

alexmarques commited on Jul 18

Create README.md

0dd8306
verified

alexmarques commited on Jul 18

Upload folder using huggingface_hub

31d9b0f
verified

alexmarques commited on Jul 11

initial commit

8b02ebe
verified

alexmarques commited on Jul 11