MARTINI_enrich_BERTopic_ZmogusAntanasZemaitis

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ZmogusAntanasZemaitis")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 20
  • Number of training documents: 3066
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 fauci - koronaviruso - visiskai - rusijos - 2020 20 -1_fauci_koronaviruso_visiskai_rusijos
0 vakcinacija - vaers - injekciju - astrazeneca - trombocitu 1759 0_vakcinacija_vaers_injekciju_astrazeneca
1 nuosirdziai - lietuvoje - pareiskimas - savanaudiskumo - вода 217 1_nuosirdziai_lietuvoje_pareiskimas_savanaudiskumo
2 украинские - россииских - мариуполя - рф - днр 140 2_украинские_россииских_мариуполя_рф
3 lietuva - izraelitu - sionizmas - krikscioniskasis - lazaras 124 3_lietuva_izraelitu_sionizmas_krikscioniskasis
4 ukrainieciai - rusija - zelenskis - volodymyro - baltarusijos 92 4_ukrainieciai_rusija_zelenskis_volodymyro
5 pandemija - koronavirusas - sukciavimas - 2020 - izoliacija 83 5_pandemija_koronavirusas_sukciavimas_2020
6 konstitucijai - registru - prokuratura - akivaizdziai - dokumenta 83 6_konstitucijai_registru_prokuratura_akivaizdziai
7 filmukas - lietuviskai - televizijos - komentare - filosofiniu 75 7_filmukas_lietuviskai_televizijos_komentare
8 implantai - technokratu - transhumanizmo - mikroschema - robotai 74 8_implantai_technokratu_transhumanizmo_mikroschema
9 фсб - rusija - советских - николаевич - dmitrijus 71 9_фсб_rusija_советских_николаевич
10 vaccine - eurotunnel - ryanair - follow - january 57 10_vaccine_eurotunnel_ryanair_follow
11 вакцинированные - вирус - иммуннои - доктор - код 55 11_вакцинированные_вирус_иммуннои_доктор
12 atikovicius - клавдиев - teratogeniskumo - nepriklausoma - virusunera 37 12_atikovicius_клавдиев_teratogeniskumo_nepriklausoma
13 geroveslietuva - vilnius - latviu - politikai - baltic 33 13_geroveslietuva_vilnius_latviu_politikai
14 atmosferoje - stratosferos - aerozoliu - geoinzinerijos - cheminiai 33 14_atmosferoje_stratosferos_aerozoliu_geoinzinerijos
15 plastikiniu - sveikatai - fluoro - kofeinas - bpa 31 15_plastikiniu_sveikatai_fluoro_kofeinas
16 telegram - organizatoriai - facebook - reklama - просмотров 29 16_telegram_organizatoriai_facebook_reklama
17 satanizmo - illuminatus - revoliucijas - jezuitu - klystkeliu 27 17_satanizmo_illuminatus_revoliucijas_jezuitu
18 virusologijos - pandemijos - patogenai - laboratoriskai - lietuviski 26 18_virusologijos_pandemijos_patogenai_laboratoriskai

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
4
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.