Helsinki-NLP/opus_books
Viewer
•
Updated
•
1.25M
•
30.7k
•
64
Note MFAQ es un corpus multilingüe de preguntas frecuentes extraídas de Common Crawl.
Note Presentamos XLSum, un conjunto de datos integral y diverso que comprende 1.35 millones de pares de artículos y resúmenes anotados profesionalmente de la BBC, extraídos utilizando un conjunto de heurísticas cuidadosamente diseñadas. El conjunto de datos cubre 45 idiomas, desde recursos bajos hasta altos, muchos de los cuales no cuentan actualmente con un conjunto de datos público disponible. XL-Sum es altamente abstractivo, conciso y de alta calidad, como lo indican las evaluaciones humanas e int
Note Este dataset se podria usar para crear el dataset de tool calling en español
Note para entrenar sentence transformer