MARTINI_enrich_BERTopic_gintaras_fpublic

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_gintaras_fpublic")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 27
  • Number of training documents: 2934
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 pandemija - lietuva - pfizer - grafeno - 2020 22 -1_pandemija_lietuva_pfizer_grafeno
0 bankininkystes - banku - kriptovaliutu - euru - naira 1763 0_bankininkystes_banku_kriptovaliutu_euru
1 zelenskiui - ukrainieciai - rusija - putinui - baltarusijoje 110 1_zelenskiui_ukrainieciai_rusija_putinui
2 trumpi - kontrolinissuvisplius - sekmadienio - video - kompetencija 106 2_trumpi_kontrolinissuvisplius_sekmadienio_video
3 grybauskaites - konservatoriai - politikoje - apzvalgininkas - kandidatas 94 3_grybauskaites_konservatoriai_politikoje_apzvalgininkas
4 daugiausiai - transliacija - tradiciniu - 19 - ketvirtadieni 71 4_daugiausiai_transliacija_tradiciniu_19
5 vakcinacijos - covid - omicron - imuniteto - virusa 70 5_vakcinacijos_covid_omicron_imuniteto
6 pfizer - vakcinacijos - omicron - klinikiniu - europos 68 6_pfizer_vakcinacijos_omicron_klinikiniu
7 koronavirusu - pseudopandemijos - 2020 - pacientu - skaicius 59 7_koronavirusu_pseudopandemijos_2020_pacientu
8 transseksualas - lesbieciu - protesta - vaivorykstine - pride 58 8_transseksualas_lesbieciu_protesta_vaivorykstine
9 energijos - elektriniu - skaitikliai - kwh - konkursa 43 9_energijos_elektriniu_skaitikliai_kwh
10 zurnalistai - garbaciauskaite - televizija - propagandos - transliuotoja 41 10_zurnalistai_garbaciauskaite_televizija_propagandos
11 europarlamentare - partija - apklausoje - rezultatai - nepalankiausiai 36 11_europarlamentare_partija_apklausoje_rezultatai
12 konstitucijai - lietuviu - nustatytus - teismu - principui 36 12_konstitucijai_lietuviu_nustatytus_teismu
13 citata - isvykima - genijai - negirdeciau - atatiurkas 34 13_citata_isvykima_genijai_negirdeciau
14 proeuropietiska - korupcijos - migrantu - belgijos - partijos 33 14_proeuropietiska_korupcijos_migrantu_belgijos
15 antikorupcijos - prokuroras - institucija - atliekami - pedopartija 32 15_antikorupcijos_prokuroras_institucija_atliekami
16 trumpas - bidenas - prezidentus - amerikieciu - clinton 32 16_trumpas_bidenas_prezidentus_amerikieciu
17 nebandziusiems - lietuviskai - nepazistamaisiais - negincijamai - issilavinimas 30 17_nebandziusiems_lietuviskai_nepazistamaisiais_negincijamai
18 gatesas - billo - globalistu - filantropas - microsoft 28 18_gatesas_billo_globalistu_filantropas
19 palestinieciai - netanyahu - hamas - izraelyje - teroristai 25 19_palestinieciai_netanyahu_hamas_izraelyje
20 gazprom - rusijai - latvijas - sberbank - ekonomiku 24 20_gazprom_rusijai_latvijas_sberbank
21 feisbuke - cenzura - nevilnietiskai - profilio - infografika 24 21_feisbuke_cenzura_nevilnietiskai_profilio
22 faucis - koronaviruso - pseudopandemijos - amerikos - laboratorija 24 22_faucis_koronaviruso_pseudopandemijos_amerikos
23 ministerija - viceministras - kudarauskiene - situacijai - politine 24 23_ministerija_viceministras_kudarauskiene_situacijai
24 twitter - trumpo - dezinformacija - tviteryje - muskas 24 24_twitter_trumpo_dezinformacija_tviteryje
25 bidenas - viceprezidentu - korupcinius - ukrainoje - hunteriui 23 25_bidenas_viceprezidentu_korupcinius_ukrainoje

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
5
Inference Providers NEW
This model is not currently available via any of the supported third-party Inference Providers, and the model is not deployed on the HF Inference API.