exodeus commited on
Commit
2270d6d
·
verified ·
1 Parent(s): 131be25

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +62 -5
README.md CHANGED
@@ -1,5 +1,62 @@
1
- ---
2
- license: other
3
- license_name: creative-commons-attribution-noncommercial
4
- license_link: LICENSE
5
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ license: other
3
+ license_name: creative-commons-attribution-noncommercial
4
+ license_link: >-
5
+ https://raw.githubusercontent.com/idleberg/Creative-Commons-Markdown/refs/heads/main/4.0/by-nc-nd.markdown
6
+ language:
7
+ - en
8
+ metrics:
9
+ - accuracy
10
+ base_model:
11
+ - xlnet/xlnet-base-cased
12
+ pipeline_tag: text-classification
13
+ library_name: sklearn
14
+ tags:
15
+ - Emotions
16
+ ---
17
+
18
+ # Classificateur d'émotions basé sur XLNet
19
+
20
+ Ce projet implémente un classificateur d'émotions pour les textes français en utilisant le modèle XLNet pré-entraîné et
21
+ fine-tuné (xlnet-base-cased). Il est capable de détecter les émotions suivantes : joie, peur, colère, tristesse.
22
+
23
+
24
+ ## Dataset
25
+
26
+ Le modèle a été entraîné sur un jeu de données contenant des annotations d'émotions pour des messages textuels en français.
27
+ Les données ont été nettoyées et prétraitées avant d'être utilisées pour l'entraînement du modèle.
28
+ Le dataset original est désequilibré, c'est pourquoi on a rééquilibré les classes afin d'avoir une meilleure performance.
29
+ Après le prétraitement et le rééquilibrage, on obtient un dataset de 12000 lignes.
30
+
31
+ ## Entraînement
32
+
33
+ Le modèle XLNet a été fine-tuné sur les données d'entraînement pendant 5 époques avec un taux d'apprentissage adapté pour
34
+ optimiser les performances.
35
+ La métrique d'évaluation utilisée est l'accuracy.
36
+ Les données on été divisé en 3 parties :
37
+ 80% pour l'entrainement, 10% pour la validation et 10% pour les tests.
38
+
39
+ ## Performances
40
+
41
+ Le modèle a obtenu une accuracy de plus de 91% sur l'ensemble de validation et de test.
42
+ Les prédictions sur des exemples choisis se sont avérées pertinentes.
43
+
44
+ **Interprétation des outputs :**
45
+
46
+ * **Accuracy :** Le modèle a atteint une accuracy de plus de 90 % sur les données de validation et de test, ce qui indique
47
+ * sa capacité à prédire correctement l'émotion dans la plupart des cas.
48
+ * **Pertes :** La courbe de perte pendant l'entraînement montre une diminution progressive, ce qui signifie que le modèle
49
+ * apprend et s'améliore au fil des époques.
50
+ * **Prédictions :** Les exemples de prédictions sur des textes de validation montrent que le modèle est capable d'identifier
51
+ * l'émotion dominante avec une probabilité élevée.
52
+ * On remarque aussi que le modèle a une bonne précision avec un score F1 de 0.91.
53
+ * Ce qui est un bon indicateur de la performance du modèle.
54
+ * **Matrice de confusion:** La matrice de confusion montre que le modèle est capable de distinguer les différentes émotions
55
+ * avec une bonne précision. Cependant, il y a quelques confusions entre les émotions "joie" et "peur", ce qui est compréhensible
56
+ * car ces émotions peuvent parfois être exprimées de manière similaire dans les textes.
57
+
58
+
59
+ ## Utilisation
60
+
61
+ Pour utiliser le modèle, vous pouvez charger le pipeline Hugging Face et passer un texte en entrée pour obtenir la prédiction
62
+ d'émotion et les probabilités associées.