MARTINI_enrich_BERTopic_kapadokyahaber
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_kapadokyahaber")
topic_model.get_topic_info()
Topic overview
- Number of topics: 16
- Number of training documents: 1025
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | yılı - turkiye - gerceklestirildi - anadolu - nevsehir | 21 | -1_yılı_turkiye_gerceklestirildi_anadolu |
0 | nevsehir - kapsamında - yonetim - hizmetlerinde - tesisatı | 379 | 0_nevsehir_kapsamında_yonetim_hizmetlerinde |
1 | haberleri - bombası - sayısının - kapısına - kilicdaroglu | 142 | 1_haberleri_bombası_sayısının_kapısına |
2 | izmir - kırsehir - fırtınalı - meteorolojiden - ankara | 58 | 2_izmir_kırsehir_fırtınalı_meteorolojiden |
3 | kırıkkale - sakarya - afyonkarahisar - trabzon - malatya | 56 | 3_kırıkkale_sakarya_afyonkarahisar_trabzon |
4 | koronavirus - vakanın - haritasında - izmir - riskli | 43 | 4_koronavirus_vakanın_haritasında_izmir |
5 | akademisyenleri - rektoru - kaymakamlıgı - sekreteri - universiteler | 42 | 5_akademisyenleri_rektoru_kaymakamlıgı_sekreteri |
6 | kılıcdaroglu - erdogan - hatıralarımız - yasayacagı - federasyonu | 41 | 6_kılıcdaroglu_erdogan_hatıralarımız_yasayacagı |
7 | canakkale - bayramını - mesajı - marsı - dolayısıyla | 39 | 7_canakkale_bayramını_mesajı_marsı |
8 | kırıkkale - cankırı - afyonkarahisar - diyarbakır - karaman | 37 | 8_kırıkkale_cankırı_afyonkarahisar_diyarbakır |
9 | kovid - corona - haberleri - acıklandı - koca | 33 | 9_kovid_corona_haberleri_acıklandı |
10 | agustos - eylul - kararları - 2023 - gazete | 32 | 10_agustos_eylul_kararları_2023 |
11 | nevsehir - sahur - saatleri - ramazan - iftar | 32 | 11_nevsehir_sahur_saatleri_ramazan |
12 | altın - pazar - gram - 2023 - ceyrek | 25 | 12_altın_pazar_gram_2023 |
13 | bayram - mersin - kırsehir - afyonkarahisar - sanlıurfa | 23 | 13_bayram_mersin_kırsehir_afyonkarahisar |
14 | altın - ceyrek - pazar - 2023 - durum | 22 | 14_altın_ceyrek_pazar_2023 |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 5
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.