Preference Datasets for KTO - a argilla Collection

argilla 's Collections

Synthetic Data Generator

Datasets built with ⚗️ distilabel

Open Image Generation Models

Argilla v2.0 compatible datasets

DIBT Prompt collective SPIN

Preference Datasets for DPO

Preference Datasets for KTO

Domain Specific Data

Preference Datasets for KTO

updated Dec 11, 2024

This collection contains a list of curated preference datasets for KTO fine-tuning for intent alignment of LLMs through signals.

argilla/ultrafeedback-binarized-preferences-cleaned-kto

Viewer • Updated Mar 19, 2024 • 231k • 159 • 9

Note KTO transformed version of "argilla/ultrafeedback-binarized-preferences-cleaned".
argilla/distilabel-intel-orca-kto

Viewer • Updated Mar 19, 2024 • 23.1k • 79 • 7

Note KTO transformed version of "argilla/distilabel-intel-orca-dpo-pairs"
argilla/distilabel-capybara-kto-15k-binarized

Viewer • Updated Mar 19, 2024 • 15.1k • 80 • 5

Note KTO transformed version of "argilla/distilabel-capybara-dpo-7k-binarized".
argilla/kto-mix-15k

Viewer • Updated Apr 19, 2024 • 15.3k • 122 • 13

Note KTO transformed version of "argilla/dpo-mix-7k".
KTO: Model Alignment as Prospect Theoretic Optimization

Paper • 2402.01306 • Published Feb 2, 2024 • 16