MARTINI_enrich_BERTopic_canal_antifeminista

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_canal_antifeminista")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 17
  • Number of training documents: 1878
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 pandemia - coronavac - bloqueios - brasil - dados 22 -1_pandemia_coronavac_bloqueios_brasil
0 feministas - satanico - prostituicao - religiosas - filhos 875 0_feministas_satanico_prostituicao_religiosas
1 senado - constituicao - silveira - prisao - advogados 181 1_senado_constituicao_silveira_prisao
2 jornalista - globo - reportagem - cnn - censura 107 2_jornalista_globo_reportagem_cnn
3 votacao - deputados - dilma - impressao - semipresidencialismo 87 3_votacao_deputados_dilma_impressao
4 vacinadas - pfizer - injecao - abortos - faleceu 85 4_vacinadas_pfizer_injecao_abortos
5 vacinados - passaporte - obrigatoriedade - decreto - trabalhadores 82 5_vacinados_passaporte_obrigatoriedade_decreto
6 bolsonaro - estaduais - setembro - manifestacoes - militares 75 6_bolsonaro_estaduais_setembro_manifestacoes
7 bolsonaro - corrupcao - senado - jorginho - barros 70 7_bolsonaro_corrupcao_senado_jorginho
8 ivermectina - antimalarico - coronavirus - prevencao - vitamina 58 8_ivermectina_antimalarico_coronavirus_prevencao
9 dinheiro - impostos - corrupcao - campanha - henrique 50 9_dinheiro_impostos_corrupcao_campanha
10 wuhan - chinesa - taiwan - comunista - pompeo 39 10_wuhan_chinesa_taiwan_comunista
11 vacinados - coronavirus - janeiro - variantes - populacoes 37 11_vacinados_coronavirus_janeiro_variantes
12 coronavac - bolsonaro - reinfectado - negacionismo - magufuli 31 12_coronavac_bolsonaro_reinfectado_negacionismo
13 cuba - repressivos - comunista - manifestantes - fidel 30 13_cuba_repressivos_comunista_manifestantes
14 queimadas - vandalismo - protestos - esquerdista - florestais 26 14_queimadas_vandalismo_protestos_esquerdista
15 talibas - cabul - afegaos - refugiados - extremistas 23 15_talibas_cabul_afegaos_refugiados

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
4
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.