MARTINI_enrich_BERTopic_gintaras_fpublic
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_gintaras_fpublic")
topic_model.get_topic_info()
Topic overview
- Number of topics: 27
- Number of training documents: 2934
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | pandemija - lietuva - pfizer - grafeno - 2020 | 22 | -1_pandemija_lietuva_pfizer_grafeno |
0 | bankininkystes - banku - kriptovaliutu - euru - naira | 1763 | 0_bankininkystes_banku_kriptovaliutu_euru |
1 | zelenskiui - ukrainieciai - rusija - putinui - baltarusijoje | 110 | 1_zelenskiui_ukrainieciai_rusija_putinui |
2 | trumpi - kontrolinissuvisplius - sekmadienio - video - kompetencija | 106 | 2_trumpi_kontrolinissuvisplius_sekmadienio_video |
3 | grybauskaites - konservatoriai - politikoje - apzvalgininkas - kandidatas | 94 | 3_grybauskaites_konservatoriai_politikoje_apzvalgininkas |
4 | daugiausiai - transliacija - tradiciniu - 19 - ketvirtadieni | 71 | 4_daugiausiai_transliacija_tradiciniu_19 |
5 | vakcinacijos - covid - omicron - imuniteto - virusa | 70 | 5_vakcinacijos_covid_omicron_imuniteto |
6 | pfizer - vakcinacijos - omicron - klinikiniu - europos | 68 | 6_pfizer_vakcinacijos_omicron_klinikiniu |
7 | koronavirusu - pseudopandemijos - 2020 - pacientu - skaicius | 59 | 7_koronavirusu_pseudopandemijos_2020_pacientu |
8 | transseksualas - lesbieciu - protesta - vaivorykstine - pride | 58 | 8_transseksualas_lesbieciu_protesta_vaivorykstine |
9 | energijos - elektriniu - skaitikliai - kwh - konkursa | 43 | 9_energijos_elektriniu_skaitikliai_kwh |
10 | zurnalistai - garbaciauskaite - televizija - propagandos - transliuotoja | 41 | 10_zurnalistai_garbaciauskaite_televizija_propagandos |
11 | europarlamentare - partija - apklausoje - rezultatai - nepalankiausiai | 36 | 11_europarlamentare_partija_apklausoje_rezultatai |
12 | konstitucijai - lietuviu - nustatytus - teismu - principui | 36 | 12_konstitucijai_lietuviu_nustatytus_teismu |
13 | citata - isvykima - genijai - negirdeciau - atatiurkas | 34 | 13_citata_isvykima_genijai_negirdeciau |
14 | proeuropietiska - korupcijos - migrantu - belgijos - partijos | 33 | 14_proeuropietiska_korupcijos_migrantu_belgijos |
15 | antikorupcijos - prokuroras - institucija - atliekami - pedopartija | 32 | 15_antikorupcijos_prokuroras_institucija_atliekami |
16 | trumpas - bidenas - prezidentus - amerikieciu - clinton | 32 | 16_trumpas_bidenas_prezidentus_amerikieciu |
17 | nebandziusiems - lietuviskai - nepazistamaisiais - negincijamai - issilavinimas | 30 | 17_nebandziusiems_lietuviskai_nepazistamaisiais_negincijamai |
18 | gatesas - billo - globalistu - filantropas - microsoft | 28 | 18_gatesas_billo_globalistu_filantropas |
19 | palestinieciai - netanyahu - hamas - izraelyje - teroristai | 25 | 19_palestinieciai_netanyahu_hamas_izraelyje |
20 | gazprom - rusijai - latvijas - sberbank - ekonomiku | 24 | 20_gazprom_rusijai_latvijas_sberbank |
21 | feisbuke - cenzura - nevilnietiskai - profilio - infografika | 24 | 21_feisbuke_cenzura_nevilnietiskai_profilio |
22 | faucis - koronaviruso - pseudopandemijos - amerikos - laboratorija | 24 | 22_faucis_koronaviruso_pseudopandemijos_amerikos |
23 | ministerija - viceministras - kudarauskiene - situacijai - politine | 24 | 23_ministerija_viceministras_kudarauskiene_situacijai |
24 | twitter - trumpo - dezinformacija - tviteryje - muskas | 24 | 24_twitter_trumpo_dezinformacija_tviteryje |
25 | bidenas - viceprezidentu - korupcinius - ukrainoje - hunteriui | 23 | 25_bidenas_viceprezidentu_korupcinius_ukrainoje |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 5
Inference Providers
NEW
This model is not currently available via any of the supported third-party Inference Providers, and
the model is not deployed on the HF Inference API.