Safetensors
GGUF
llama
Inference Endpoints