yaniseuranova
/

setfit-rag-hybrid-search-query-router

@@ -48,7 +48,7 @@ The model has been trained using an efficient few-shot learning technique that i
 - **Sentence Transformer body:** [sentence-transformers/paraphrase-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-mpnet-base-v2)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
 - **Maximum Sequence Length:** 512 tokens
-- **Number of Classes:** 4 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
@@ -60,12 +60,14 @@ The model has been trained using an efficient few-shot learning technique that i
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
-| Label                 | Examples                                                                                                                                                                                                               |
-|:----------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
-| very_semantic_queries | <ul><li>'Quels sont les principes fondamentaux du développement durable?'</li><li>"Comment améliorer l'efficacité énergétique dans les bâtiments?"</li><li>'Combien de calories dans une pomme?'</li></ul>             |
-| very_lexical          | <ul><li>"Quelle est la capitale de l'Italie?"</li><li>"Qui est l'auteur de '1984'?"</li><li>'What is the current unemployment rate in France?'</li></ul>                                                               |
-| semantic_queries      | <ul><li>"Quels sont les avantages de l'apprentissage machine dans le secteur de la santé?"</li><li>'Comment puis-je optimiser les performances de mon site web?'</li><li>'Comment fonctionne la blockchain?'</li></ul> |
-| lexical               | <ul><li>'Quel est le numéro de téléphone du service client?'</li><li>'How can I reset my password?'</li><li>'What is the zip code for New York?'</li></ul>                                                             |
 ## Evaluation
@@ -124,14 +126,14 @@ preds = model("Comment rédiger un bon CV?")
 ### Training Set Metrics
 | Training set | Min | Median | Max |
 |:-------------|:----|:-------|:----|
-| Word count   | 4   | 7.0667 | 13  |
 | Label                 | Training Sample Count |
 |:----------------------|:----------------------|
-| very_semantic_queries | 17                    |
 | semantic_queries      | 18                    |
-| lexical_queries       | 0                     |
-| very_lexical          | 16                    |
 ### Training Hyperparameters
 - batch_size: (16, 16)
@@ -153,24 +155,24 @@ preds = model("Comment rédiger un bon CV?")
 ### Training Results
 | Epoch   | Step    | Training Loss | Validation Loss |
 |:-------:|:-------:|:-------------:|:---------------:|
-| 0.0060  | 1       | 0.4001        | -               |
-| 0.3012  | 50      | 0.1902        | -               |
-| 0.6024  | 100     | 0.0223        | -               |
-| 0.9036  | 150     | 0.0008        | -               |
-| 1.0     | 166     | -             | 0.0009          |
-| 1.2048  | 200     | 0.001         | -               |
-| 1.5060  | 250     | 0.0007        | -               |
-| 1.8072  | 300     | 0.0006        | -               |
-| 2.0     | 332     | -             | 0.0003          |
-| 2.1084  | 350     | 0.0006        | -               |
-| 2.4096  | 400     | 0.0003        | -               |
-| 2.7108  | 450     | 0.0004        | -               |
-| 3.0     | 498     | -             | 0.0002          |
-| 3.0120  | 500     | 0.0002        | -               |
-| 3.3133  | 550     | 0.0003        | -               |
-| 3.6145  | 600     | 0.0003        | -               |
-| 3.9157  | 650     | 0.0003        | -               |
-| **4.0** | **664** | **-**         | **0.0001**      |
 * The bold row denotes the saved checkpoint.
 ### Framework Versions

 - **Sentence Transformer body:** [sentence-transformers/paraphrase-mpnet-base-v2](https://huggingface.co/sentence-transformers/paraphrase-mpnet-base-v2)
 - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
 - **Maximum Sequence Length:** 512 tokens
+- **Number of Classes:** 6 classes
 <!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
 <!-- - **Language:** Unknown -->
 <!-- - **License:** Unknown -->
 - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
 ### Model Labels
+| Label                 | Examples                                                                                                                                                                                                                            |
+|:----------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
+| very_semantic_queries | <ul><li>'Quels sont les principes fondamentaux du corps humain?'</li><li>"Comment améliorer l'efficacité énergétique dans les bâtiments?"</li><li>'Combien de calories dans une pomme?'</li></ul>                                   |
+| very_lexical          | <ul><li>"Quelle est la capitale de l'Italie?"</li><li>"Qui est l'auteur de '1984'?"</li><li>'What is the current unemployment rate in France?'</li></ul>                                                                            |
+| semantic_queries      | <ul><li>"Quels sont les avantages de l'apprentissage machine dans le secteur de la santé?"</li><li>'Comment puis-je optimiser les performances de mon site web?'</li><li>'What are the main challenges in cybersecurity?'</li></ul> |
+| lexical               | <ul><li>'Quel est le numéro de téléphone du service client ou du customer suport?'</li><li>'How can I reset my user password?'</li><li>'What is the zip code for New York?'</li></ul>                                               |
+| lexical_queries       | <ul><li>'Comment fonctionne la blockchain?'</li></ul>                                                                                                                                                                               |
+| lexical_query         | <ul><li>'Who won the Nobel Peace Prize in 2021?'</li></ul>                                                                                                                                                                          |
 ## Evaluation
 ### Training Set Metrics
 | Training set | Min | Median | Max |
 |:-------------|:----|:-------|:----|
+| Word count   | 4   | 7.1667 | 13  |
 | Label                 | Training Sample Count |
 |:----------------------|:----------------------|
+| very_semantic_queries | 16                    |
 | semantic_queries      | 18                    |
+| lexical_queries       | 1                     |
+| very_lexical          | 15                    |
 ### Training Hyperparameters
 - batch_size: (16, 16)
 ### Training Results
 | Epoch   | Step    | Training Loss | Validation Loss |
 |:-------:|:-------:|:-------------:|:---------------:|
+| 0.0059  | 1       | 0.4006        | -               |
+| 0.2941  | 50      | 0.1896        | -               |
+| 0.5882  | 100     | 0.052         | -               |
+| 0.8824  | 150     | 0.0042        | -               |
+| 1.0     | 170     | -             | 0.0023          |
+| 1.1765  | 200     | 0.0011        | -               |
+| 1.4706  | 250     | 0.0006        | -               |
+| 1.7647  | 300     | 0.0007        | -               |
+| 2.0     | 340     | -             | 0.0003          |
+| 2.0588  | 350     | 0.0004        | -               |
+| 2.3529  | 400     | 0.0004        | -               |
+| 2.6471  | 450     | 0.0004        | -               |
+| 2.9412  | 500     | 0.0009        | -               |
+| 3.0     | 510     | -             | 0.0003          |
+| 3.2353  | 550     | 0.0003        | -               |
+| 3.5294  | 600     | 0.0004        | -               |
+| 3.8235  | 650     | 0.0003        | -               |
+| **4.0** | **680** | **-**         | **0.0002**      |
 * The bold row denotes the saved checkpoint.
 ### Framework Versions

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "checkpoints/step_664",
   "architectures": [
     "MPNetModel"
   ],

 {
+  "_name_or_path": "checkpoints/step_680",
   "architectures": [
     "MPNetModel"
   ],

config_setfit.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-  "normalize_embeddings": false,
   "labels": [
     "very_semantic_queries",
     "semantic_queries",
     "lexical_queries",
     "very_lexical"
-  ]
 }

 {
   "labels": [
     "very_semantic_queries",
     "semantic_queries",
     "lexical_queries",
     "very_lexical"
+  ],
+  "normalize_embeddings": false
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d73c5537d6b9f04cb36ac62e63b4699fc99c23ee5198ef82ea0b2a5e052c607d
 size 437967672

 version https://git-lfs.github.com/spec/v1
+oid sha256:90b2b4e9ab2e110c6b28701f1982fe75210d765ad667f050c5225fb0e218d56e
 size 437967672

model_head.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:04a12a12e3c2b789e754f1a0857c3b2603a951df4275fd12361e1c43036fc823
-size 25783

 version https://git-lfs.github.com/spec/v1
+oid sha256:f1b648aa4a967e622bed4524cadcef504ec05d246c86c8783556500585c58c06
+size 38263