Update README.md
Browse files
README.md
CHANGED
@@ -3,30 +3,23 @@ library_name: transformers
|
|
3 |
license: apache-2.0
|
4 |
---
|
5 |
|
6 |
-
|
7 |
-
|
8 |
-
ECE-TRIOMPHANT-2.1-YL-72B-SLERP-V1
|
9 |
-
|
10 |
-
|
11 |
-
|
12 |
-
|
13 |
-
|
14 |
-
|
15 |
-
|
16 |
-
|
17 |
-
|
18 |
-
|
19 |
-
|
20 |
-
|
21 |
-
|
22 |
-
|
23 |
-
• Compréhension contextuelle.
|
24 |
-
• Tâches instructives (Instruction Following).
|
25 |
-
|
26 |
-
|
27 |
-
Détails techniques :
|
28 |
-
• Nombre de couches : Fusion basée sur les configurations des modèles sources (72 couches et 78 couches).
|
29 |
-
• Type de données : bfloat16 pour une meilleure efficacité mémoire.
|
30 |
|
31 |
|
32 |
|
|
|
3 |
license: apache-2.0
|
4 |
---
|
5 |
|
6 |
+
# **ECE-TRIOMPHANT-2.1-YL-72B-SLERP-V1**
|
7 |
+
|
8 |
+
**ECE-TRIOMPHANT-2.1-YL-72B-SLERP-V1** est un modèle de langage fusionné créé à partir des modèles **Sakalti/ultiima-72B** et **MaziyarPanahi/calme-3.2-instruct-78b**. Grâce à la méthode **SLERP (Spherical Linear Interpolation)**, il combine les forces des deux architectures pour offrir des performances optimales sur des tâches complexes de traitement du langage naturel (NLP).
|
9 |
+
|
10 |
+
## **Caractéristiques**
|
11 |
+
- **Méthode de fusion :** SLERP (Spherical Linear Interpolation).
|
12 |
+
- **Modèles sources :**
|
13 |
+
- [Sakalti/ultiima-72B](https://huggingface.co/Sakalti/ultiima-72B)
|
14 |
+
- [MaziyarPanahi/calme-3.2-instruct-78b](https://huggingface.co/MaziyarPanahi/calme-3.2-instruct-78b)
|
15 |
+
- **Points forts :**
|
16 |
+
- Performances améliorées sur des tâches multi-domaines et de raisonnement.
|
17 |
+
- Capacité de traitement étendue grâce à la fusion des couches critiques.
|
18 |
+
- Optimisation en **bfloat16** pour des calculs rapides et efficaces.
|
19 |
+
- **Applications cibles :**
|
20 |
+
- Raisonnement mathématique.
|
21 |
+
- Compréhension contextuelle.
|
22 |
+
- Tâches instructives (Instruction Following).
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
23 |
|
24 |
|
25 |
|