Edit Models filters

Inference status

Misc

4-bit precision

AutoTrain Compatible

Inference Endpoints

text-generation-inference

Misc with no match

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

45

Full-text search

Active filters: Quantization

VPTQ-community/Qwen2.5-72B-Instruct-v16-k65536-65536-woft

Updated 4 days ago • 46 • 4

VPTQ-community/Qwen2.5-72B-Instruct-v16-k65536-32768-woft

Updated 4 days ago • 77 • 3

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-0-woft

Updated 4 days ago • 217 • 2

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-1024-woft

Updated 4 days ago • 23 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v8-k4096-0-woft

Updated 4 days ago • 21 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-64-woft

Updated 4 days ago • 59 • 3

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k32768-32768-woft

Updated 4 days ago • 31 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-128-woft

Updated 4 days ago • 16 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-4-woft

Updated 4 days ago • 17 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-0-woft

Updated 4 days ago • 163 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k512-512-woft

Updated 4 days ago • 14 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k1024-512-woft

Updated 4 days ago • 18 • 2

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-256-woft

Updated 4 days ago • 25 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-256-woft

Updated 4 days ago • 40 • 4

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-65536-woft

Updated 4 days ago • 49 • 1

VPTQ-community/Qwen2.5-32B-Instruct-v16-k65536-65536-woft

Updated 4 days ago • 72 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-65536-woft

Updated 4 days ago • 28 • 3

thephimart/tinyllama-4x1.1b-moe.Q5_K_M.gguf

Updated Jan 24 • 19 • 2

Irathernotsay/qwen2-1.5B-medical_qa-Finetune

Text Generation • Updated Jul 17 • 1

Riyuechang/Breeze-7B-PTT-Chat-v2_AWQ

Text Generation • Updated 29 days ago • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v16-k65536-32768-woft

Updated 4 days ago • 30

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-65536-woft

Updated 4 days ago • 179

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-4096-woft

Updated 4 days ago • 47

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-256-woft

Updated 4 days ago • 46

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v16-k65536-65536-woft

Updated 4 days ago • 97

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-256-woft

Updated 4 days ago • 116 • 1

VPTQ-community/Qwen2.5-7B-Instruct-v8-k65536-256-woft

Updated 4 days ago • 44

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k32768-0-woft

Updated 4 days ago • 287 • 1

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-65536-woft

Updated 4 days ago • 110 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k16384-0-woft

Updated 4 days ago • 45 • 2