PleIAs
/

KaribuAI

Text Classification

Safetensors

English

French

deberta

Model card Files Files and versions Community

irenegirard commited on 24 days ago

Commit

e893961

verified ·

1 Parent(s): 0865da6

Update README.md

Browse files

Files changed (1) hide show

README.md +14 -18

README.md CHANGED Viewed

@@ -24,48 +24,44 @@ The Karibu project is a collaboration between pleIAs, Bibliothèque sans fronti
 ## Karibu Language Level Classifier
 Karibu is a DeBERTa-based classifier that automatically assigns CEFR language proficiency levels (A1-C2) to French educational content.
-Model Characteristics
 ## Architecture: DeBERTa with multi-head classification
-Base Model: PleIAs/celadon
-Model Size: Fine-tuned from DeBERTa-v3-small
-Output: 6 classification levels (A1, A2, B1, B2, C1, C2)
 🤖 [Explore the Celadon model](https://huggingface.co/PleIAs/celadon)
 ## Training Details
-Training Data: 9,000 synthetic samples
-Source: French press articles + Wikimedia content
-Processing: Sequential text simplification using an open source model (to come)
-Validation: 1,000 samples per level manually verified by BSF experts
 ## Topics Coverage:
 - solidarity, geography, African literature, agriculture, tourism, cultural events, African history, geopolitics, communication
-Topic Filtering: Meta-Llama-3-8B-Instruct for content categorization
-Annotation Method:
 🔍 [Explore the full dataset](https://huggingface.co/datasets/PleIAs/KaribuAI/viewer/default)
 ## levels
-Manual verification using CEFR framework criteria
-Statistical validation using Louvain word-level classification
 ## Technical Integration
-Deployment: Offline-capable via microSD cards
-Format: H5P-compatible for interactive exercises
-Input Processing: Handles various text types (academic writing, press articles, emails, letters, stories)
 ## Collaborators
-PleIAs: Technical development
-Bibliothèque Sans Frontières (BSF): Educational expertise
-Kajou: Distribution platform

 ## Karibu Language Level Classifier
 Karibu is a DeBERTa-based classifier that automatically assigns CEFR language proficiency levels (A1-C2) to French educational content.
 ## Architecture: DeBERTa with multi-head classification
+- Base Model: PleIAs/celadon
+- Model Size: Fine-tuned from DeBERTa-v3-small
+- Output : 6 classification levels (A1, A2, B1, B2, C1, C2)
 🤖 [Explore the Celadon model](https://huggingface.co/PleIAs/celadon)
 ## Training Details
+- Training Data: 9,000 synthetic samples
+- Source: French press articles + Wikimedia content
+- Processing: Sequential text simplification using an open source model (to come)
+- Validation: 1,000 samples per level manually verified by BSF experts
 ## Topics Coverage:
 - solidarity, geography, African literature, agriculture, tourism, cultural events, African history, geopolitics, communication
+- Topic Filtering: Meta-Llama-3-8B-Instruct for content categorization
 🔍 [Explore the full dataset](https://huggingface.co/datasets/PleIAs/KaribuAI/viewer/default)
 ## levels
+- Manual verification using CEFR framework criteria
+- Statistical validation using Louvain word-level classification
 ## Technical Integration
+- Deployment: Offline-capable via microSD cards
+- Format: H5P-compatible for interactive exercises
+- Input Processing: Handles various text types (academic writing, press articles, emails, letters, stories)
 ## Collaborators
+PleIAs: Technical development, Bibliothèque Sans Frontières (BSF): Educational expertise, Kajou: Distribution platform