MARTINI_enrich_BERTopic_InfoVacunas
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_InfoVacunas")
topic_model.get_topic_info()
Topic overview
- Number of topics: 23
- Number of training documents: 2670
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | infovacunas - nanoparticulas - efectos - cientificos - videos | 23 | -1_infovacunas_nanoparticulas_efectos_cientificos |
0 | infovacunas - seguidores - mentiras - censurando - telegram | 1591 | 0_infovacunas_seguidores_mentiras_censurando |
1 | infovacunas - descubierto - envenenamiento - nanohojas - graphene | 148 | 1_infovacunas_descubierto_envenenamiento_nanohojas |
2 | microburbujas - transhumanismo - hibrida - magneticos - biochips | 119 | 2_microburbujas_transhumanismo_hibrida_magneticos |
3 | vacunados - miopericarditis - cardiaco - sintomas - corazon | 95 | 3_vacunados_miopericarditis_cardiaco_sintomas |
4 | nanotecnologia - nanotubos - biochips - citotoxicidad - membrana | 72 | 4_nanotecnologia_nanotubos_biochips_citotoxicidad |
5 | vacunados - fallecido - hospitalizaciones - reportadas - sinaloa | 64 | 5_vacunados_fallecido_hospitalizaciones_reportadas |
6 | cristalitos - microfluidicos - plasmonicos - nanochips - tecnocristalografia | 59 | 6_cristalitos_microfluidicos_plasmonicos_nanochips |
7 | nanoparticulas - biologicos - ivermectina - arnm - analizaremos | 55 | 7_nanoparticulas_biologicos_ivermectina_arnm |
8 | grafeno - nanotubes - patentimages - recombinantes - kr20210028062a | 44 | 8_grafeno_nanotubes_patentimages_recombinantes |
9 | malosentendidos - comprendais - perdonara - blablabla - когда | 43 | 9_malosentendidos_comprendais_perdonara_blablabla |
10 | escolarizacion - legalidad - espana - hogar - homeschoolers | 39 | 10_escolarizacion_legalidad_espana_hogar |
11 | astrazeneca - vaxzevria - registrados - europea - sanciones | 37 | 11_astrazeneca_vaxzevria_registrados_europea |
12 | vacunacion - informes - consentimiento - deontologicos - reacciones | 35 | 12_vacunacion_informes_consentimiento_deontologicos |
13 | consciencia - disidentes - narcisistas - falsos - universitarios | 31 | 13_consciencia_disidentes_narcisistas_falsos |
14 | vacunados - coronas - microscopio - aglomerados - sanguineos | 31 | 14_vacunados_coronas_microscopio_aglomerados |
15 | вакцинах - gardasil - toxicos - autoinmunidad - abortados | 30 | 15_вакцинах_gardasil_toxicos_autoinmunidad |
16 | sabado - subtitularlo - volverlas - minutos - siguiente | 29 | 16_sabado_subtitularlo_volverlas_minutos |
17 | coronas - sinteticas - patogenos - biomoleculares - inexistentes | 26 | 17_coronas_sinteticas_patogenos_biomoleculares |
18 | contagiosos - pandemias - microorganismos - erradicacion - verminofobia | 25 | 18_contagiosos_pandemias_microorganismos_erradicacion |
19 | polimeros - pfizer - pegylated - ciclodextrina - metoxipolietilenglicol | 25 | 19_polimeros_pfizer_pegylated_ciclodextrina |
20 | infovacunas - documentos - afectados - conspiracion - magnetico | 25 | 20_infovacunas_documentos_afectados_conspiracion |
21 | episodios - antivacunas - trucadas - nanoenredos - sinopsis | 24 | 21_episodios_antivacunas_trucadas_nanoenredos |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 5
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.