Edit Models filters

Inference status

Misc

arxiv: 2405.07863

Inference Endpoints

AutoTrain Compatible

text-generation-inference

Misc with no match

4-bit precision

text-embeddings-inference

8-bit precision

Carbon Emissions

Mixture of Experts

Models

28

Full-text search

Active filters: 2405.07863

sfairXC/FsfairX-LLaMA3-RM-v0.1

Text Classification • Updated 30 days ago • 14.9k • 48

RLHFlow/pair-preference-model-LLaMA3-8B

Text Generation • Updated 30 days ago • 2.67k • 36

Salesforce/LLaMA-3-8B-SFR-Iterative-DPO-R

Text Generation • Updated Jun 12 • 434 • 74

Salesforce/LLaMA-3-8B-SFR-RM-R

Text Classification • Updated May 31 • 18 • 10

sfairXC/FsfairX-Gemma2-RM-v0.1

Text Classification • Updated Jul 9 • 344 • 5

Salesforce/LLaMA-3-8B-SFR-SFT-R

Text Generation • Updated May 31 • 10 • 7

qwp4w3hyb/SFR-Iterative-DPO-LLaMA-3-8B-R-iMat-GGUF

Text Generation • Updated May 16 • 436 • 2

RLHFlow/LLaMA3-iterative-DPO-final

Text Generation • Updated 30 days ago • 6.77k • 41

RLHFlow/LLaMA3-SFT

Text Generation • Updated 9 days ago • 6.94k • 7

TriAiExperiments/SFR-Iterative-DPO-LLaMA-3-8B-R

Text Generation • Updated May 24 • 775 • 1

sirovub/SFR-Iterative-DPO-LLaMA-3-8B-R-GGUF

Text Generation • Updated May 26 • 18 • 1

Apel-sin/llama-3-8B-iterative-DPO-final-exl2

Updated May 25 • 1

QuantFactory/pair-preference-model-LLaMA3-8B-GGUF

Text Generation • Updated May 26 • 62 • 1

thesven/SFR-Iterative-DPO-LLaMA-3-8B-R-GGUF

Updated Jul 8 • 58 • 1

sirovub/LLaMA3-iterative-DPO-final-GGUF

Text Generation • Updated May 26 • 39 • 1

OpenRLHF/Llama-3-8b-sft-mixture

Text Generation • Updated Jun 14 • 24.5k

QuantFactory/LLaMA-3-8B-SFR-Iterative-DPO-R-GGUF

Text Generation • Updated Jun 19 • 277 • 1

QuantFactory/LLaMA-3-8B-SFR-SFT-R-GGUF

Text Generation • Updated Jun 19 • 305 • 1

RichardErkhov/RLHFlow_-_pair-preference-model-LLaMA3-8B-gguf

Updated Aug 19 • 333

RichardErkhov/Salesforce_-_LLaMA-3-8B-SFR-Iterative-DPO-R-gguf

Updated Aug 21 • 309

RichardErkhov/TriAiExperiments_-_SFR-Iterative-DPO-LLaMA-3-8B-R-gguf

Updated Aug 21 • 171

RichardErkhov/OpenRLHF_-_Llama-3-8b-sft-mixture-gguf

Updated Aug 22 • 35

RLHFlow/LLaMA3-SFT-v2

Text Generation • Updated 9 days ago • 3.47k

RichardErkhov/RLHFlow_-_LLaMA3-SFT-gguf

Updated Oct 8 • 40

RichardErkhov/RLHFlow_-_LLaMA3-iterative-DPO-final-gguf

Updated Oct 8 • 31

RLHFlow/Llama3-SFT-v2.0-epoch1

Text Generation • Updated 9 days ago • 4

RLHFlow/Llama3-SFT-v2.0-epoch2

Text Generation • Updated 9 days ago • 9

RLHFlow/Llama3-SFT-v2.0-epoch3

Text Generation • Updated 9 days ago • 6