AngelPanizo's picture
Add BERTopic model
9603876 verified
metadata
tags:
  - bertopic
library_name: bertopic
pipeline_tag: text-classification

MARTINI_enrich_BERTopic_InfoVacunas

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_InfoVacunas")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 23
  • Number of training documents: 2670
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 infovacunas - nanoparticulas - efectos - cientificos - videos 23 -1_infovacunas_nanoparticulas_efectos_cientificos
0 infovacunas - seguidores - mentiras - censurando - telegram 1591 0_infovacunas_seguidores_mentiras_censurando
1 infovacunas - descubierto - envenenamiento - nanohojas - graphene 148 1_infovacunas_descubierto_envenenamiento_nanohojas
2 microburbujas - transhumanismo - hibrida - magneticos - biochips 119 2_microburbujas_transhumanismo_hibrida_magneticos
3 vacunados - miopericarditis - cardiaco - sintomas - corazon 95 3_vacunados_miopericarditis_cardiaco_sintomas
4 nanotecnologia - nanotubos - biochips - citotoxicidad - membrana 72 4_nanotecnologia_nanotubos_biochips_citotoxicidad
5 vacunados - fallecido - hospitalizaciones - reportadas - sinaloa 64 5_vacunados_fallecido_hospitalizaciones_reportadas
6 cristalitos - microfluidicos - plasmonicos - nanochips - tecnocristalografia 59 6_cristalitos_microfluidicos_plasmonicos_nanochips
7 nanoparticulas - biologicos - ivermectina - arnm - analizaremos 55 7_nanoparticulas_biologicos_ivermectina_arnm
8 grafeno - nanotubes - patentimages - recombinantes - kr20210028062a 44 8_grafeno_nanotubes_patentimages_recombinantes
9 malosentendidos - comprendais - perdonara - blablabla - когда 43 9_malosentendidos_comprendais_perdonara_blablabla
10 escolarizacion - legalidad - espana - hogar - homeschoolers 39 10_escolarizacion_legalidad_espana_hogar
11 astrazeneca - vaxzevria - registrados - europea - sanciones 37 11_astrazeneca_vaxzevria_registrados_europea
12 vacunacion - informes - consentimiento - deontologicos - reacciones 35 12_vacunacion_informes_consentimiento_deontologicos
13 consciencia - disidentes - narcisistas - falsos - universitarios 31 13_consciencia_disidentes_narcisistas_falsos
14 vacunados - coronas - microscopio - aglomerados - sanguineos 31 14_vacunados_coronas_microscopio_aglomerados
15 вакцинах - gardasil - toxicos - autoinmunidad - abortados 30 15_вакцинах_gardasil_toxicos_autoinmunidad
16 sabado - subtitularlo - volverlas - minutos - siguiente 29 16_sabado_subtitularlo_volverlas_minutos
17 coronas - sinteticas - patogenos - biomoleculares - inexistentes 26 17_coronas_sinteticas_patogenos_biomoleculares
18 contagiosos - pandemias - microorganismos - erradicacion - verminofobia 25 18_contagiosos_pandemias_microorganismos_erradicacion
19 polimeros - pfizer - pegylated - ciclodextrina - metoxipolietilenglicol 25 19_polimeros_pfizer_pegylated_ciclodextrina
20 infovacunas - documentos - afectados - conspiracion - magnetico 25 20_infovacunas_documentos_afectados_conspiracion
21 episodios - antivacunas - trucadas - nanoenredos - sinopsis 24 21_episodios_antivacunas_trucadas_nanoenredos

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12