MARTINI_enrich_BERTopic_ZmogusAntanasZemaitis
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ZmogusAntanasZemaitis")
topic_model.get_topic_info()
Topic overview
- Number of topics: 20
- Number of training documents: 3066
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | fauci - koronaviruso - visiskai - rusijos - 2020 | 20 | -1_fauci_koronaviruso_visiskai_rusijos |
0 | vakcinacija - vaers - injekciju - astrazeneca - trombocitu | 1759 | 0_vakcinacija_vaers_injekciju_astrazeneca |
1 | nuosirdziai - lietuvoje - pareiskimas - savanaudiskumo - вода | 217 | 1_nuosirdziai_lietuvoje_pareiskimas_savanaudiskumo |
2 | украинские - россииских - мариуполя - рф - днр | 140 | 2_украинские_россииских_мариуполя_рф |
3 | lietuva - izraelitu - sionizmas - krikscioniskasis - lazaras | 124 | 3_lietuva_izraelitu_sionizmas_krikscioniskasis |
4 | ukrainieciai - rusija - zelenskis - volodymyro - baltarusijos | 92 | 4_ukrainieciai_rusija_zelenskis_volodymyro |
5 | pandemija - koronavirusas - sukciavimas - 2020 - izoliacija | 83 | 5_pandemija_koronavirusas_sukciavimas_2020 |
6 | konstitucijai - registru - prokuratura - akivaizdziai - dokumenta | 83 | 6_konstitucijai_registru_prokuratura_akivaizdziai |
7 | filmukas - lietuviskai - televizijos - komentare - filosofiniu | 75 | 7_filmukas_lietuviskai_televizijos_komentare |
8 | implantai - technokratu - transhumanizmo - mikroschema - robotai | 74 | 8_implantai_technokratu_transhumanizmo_mikroschema |
9 | фсб - rusija - советских - николаевич - dmitrijus | 71 | 9_фсб_rusija_советских_николаевич |
10 | vaccine - eurotunnel - ryanair - follow - january | 57 | 10_vaccine_eurotunnel_ryanair_follow |
11 | вакцинированные - вирус - иммуннои - доктор - код | 55 | 11_вакцинированные_вирус_иммуннои_доктор |
12 | atikovicius - клавдиев - teratogeniskumo - nepriklausoma - virusunera | 37 | 12_atikovicius_клавдиев_teratogeniskumo_nepriklausoma |
13 | geroveslietuva - vilnius - latviu - politikai - baltic | 33 | 13_geroveslietuva_vilnius_latviu_politikai |
14 | atmosferoje - stratosferos - aerozoliu - geoinzinerijos - cheminiai | 33 | 14_atmosferoje_stratosferos_aerozoliu_geoinzinerijos |
15 | plastikiniu - sveikatai - fluoro - kofeinas - bpa | 31 | 15_plastikiniu_sveikatai_fluoro_kofeinas |
16 | telegram - organizatoriai - facebook - reklama - просмотров | 29 | 16_telegram_organizatoriai_facebook_reklama |
17 | satanizmo - illuminatus - revoliucijas - jezuitu - klystkeliu | 27 | 17_satanizmo_illuminatus_revoliucijas_jezuitu |
18 | virusologijos - pandemijos - patogenai - laboratoriskai - lietuviski | 26 | 18_virusologijos_pandemijos_patogenai_laboratoriskai |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 4
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.