HuggingFaceTB
/

SmolLM2-1.7B-Instruct

Text Generation

Transformers.js

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

SmolLM2-1.7B-Instruct / onnx /model_quantized.onnx

Commit History

Fix q8 weights (use uint8 for q8; int8 produces poor results) (#18)

b75eb65
verified

Xenova HF staff commited on Nov 26, 2024

Upload optimized ONNX weights (deduplicated) (#17)

b36fc77
verified

Xenova HF staff commited on Nov 26, 2024