MARTINI_enrich_BERTopic_SMHaber0
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_SMHaber0")
topic_model.get_topic_info()
Topic overview
- Number of topics: 22
- Number of training documents: 2495
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | bakanlıgı - kılıcdaroglu - erdogan - sanlıurfa - mustafa | 20 | -1_bakanlıgı_kılıcdaroglu_erdogan_sanlıurfa |
0 | hamas - netanyahu - basbakanı - yemen - filistinli | 1328 | 0_hamas_netanyahu_basbakanı_yemen |
1 | fenerbahceli - kayserispor - sampiyonlar - federasyonu - taraftarları | 131 | 1_fenerbahceli_kayserispor_sampiyonlar_federasyonu |
2 | erdogan - fedakarlık - ihtiyacımız - sıkıntıları - kaynaklarımızı | 106 | 2_erdogan_fedakarlık_ihtiyacımız_sıkıntıları |
3 | aldıgımız - kızılay - parasıyla - bilmiyorum - balık | 102 | 3_aldıgımız_kızılay_parasıyla_bilmiyorum |
4 | harekatı - irak - kuzeyindeki - pkk - bombalı | 76 | 4_harekatı_irak_kuzeyindeki_pkk |
5 | fiyatı - lirası - usd - turkiyetekyurek - milyon | 76 | 5_fiyatı_lirası_usd_turkiyetekyurek |
6 | baskanlıgı - adaylıgına - milliyetci - haberturk - partisi | 76 | 6_baskanlıgı_adaylıgına_milliyetci_haberturk |
7 | kremlin - federasyonu - ermenistan - devamına - belarus | 72 | 7_kremlin_federasyonu_ermenistan_devamına |
8 | agırlastırılmıs - kurtarılamadı - eskisehir - babasını - yaslarındaki | 64 | 8_agırlastırılmıs_kurtarılamadı_eskisehir_babasını |
9 | anadolu - erdogan - kılıcdaroglu - acıklandıgında - sandıkların | 61 | 9_anadolu_erdogan_kılıcdaroglu_acıklandıgında |
10 | kılıcdaroglu - haklısınız - ataturkcu - buyuksehir - demokrasiden | 56 | 10_kılıcdaroglu_haklısınız_ataturkcu_buyuksehir |
11 | tiktok - instagram - facebook - farklılıgına - paylastı | 53 | 11_tiktok_instagram_facebook_farklılıgına |
12 | bayraktar - anadolu - havacılık - hızlı - motorlarımız | 43 | 12_bayraktar_anadolu_havacılık_hızlı |
13 | polisleri - kullandıgım - seyidogulları - memurlarına - oktay | 36 | 13_polisleri_kullandıgım_seyidogulları_memurlarına |
14 | sınavların - universitelerde - kurumları - yuksekogretim - haberlerinizi | 33 | 14_sınavların_universitelerde_kurumları_yuksekogretim |
15 | kılıcdaroglu - kaldıracagım - vatanımızı - bırakmayacagız - mezarına | 31 | 15_kılıcdaroglu_kaldıracagım_vatanımızı_bırakmayacagız |
16 | erdemoglu - adaylıgı - fatih - dunyanın - celladına | 30 | 16_erdemoglu_adaylıgı_fatih_dunyanın |
17 | kahramanmaras - malatya - hayrettin - merkezli - yıkıldıgını | 29 | 17_kahramanmaras_malatya_hayrettin_merkezli |
18 | hizbullahcı - yapsaydım - milliyetcisi - politikalarını - hatırlatırım | 27 | 18_hizbullahcı_yapsaydım_milliyetcisi_politikalarını |
19 | diyarbakır - meteorolojiye - sıcaklıkların - saraykoy - karpuzlu | 25 | 19_diyarbakır_meteorolojiye_sıcaklıkların_saraykoy |
20 | karsılayabiliyoruz - istihbaratın - televizyonun - gelmeyeceklerini - yazılmasına | 20 | 20_karsılayabiliyoruz_istihbaratın_televizyonun_gelmeyeceklerini |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 5
Inference Providers
NEW
This model is not currently available via any of the supported Inference Providers.