jorge-henao commited on
Commit
477a678
·
1 Parent(s): c71de7a

Update about.py

Browse files
Files changed (1) hide show
  1. about.py +22 -0
about.py CHANGED
@@ -12,8 +12,30 @@ def show_about_ask2democracy():
12
  Textos indexados: Propuesta reforma pensional de Marzo 22 de 2023, Propuesta reforma de la salud del 13 febrero 2023 , Capítulo de hallazgos y recomendaciones de la comisión de la verdad (trabajo en progreso, si quieres apoyar escríbeme)
13
  <div align="right">
14
  Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a href="https://www.linkedin.com/in/henaojorge" target='_blank'>LinkedIn</a> <a href="https://linktr.ee/jorgehenao" target='_blank'>Linktree</a>
 
15
  </div>
16
  <p>
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
17
  <h2>¿Cómo utilizar este espacio?</h2>
18
  Selecciona el de documento que quieres explorar en el panel de la izquierda, escribe preguntas en la caja de texto y presiona el botón.
19
  No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta mejores resultados obtienes.
 
12
  Textos indexados: Propuesta reforma pensional de Marzo 22 de 2023, Propuesta reforma de la salud del 13 febrero 2023 , Capítulo de hallazgos y recomendaciones de la comisión de la verdad (trabajo en progreso, si quieres apoyar escríbeme)
13
  <div align="right">
14
  Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a href="https://www.linkedin.com/in/henaojorge" target='_blank'>LinkedIn</a> <a href="https://linktr.ee/jorgehenao" target='_blank'>Linktree</a>
15
+ Con el apoyo de David Torres 🇨🇴 <a href="https://twitter.com/davinci137" target='_blank'>Twitter</a> <a href="https://github.com/datorresb" target='_blank'>LinkedIn</a>
16
  </div>
17
  <p>
18
+
19
+ <h2>Sobre el trabajo realizado durante la Hackaton Somos NLP 2023</h2>
20
+ El proyecto Ask2Democracy fue creado antes de la hackathon Somos NLP 2023. Sin embargo durante las fechas de la hackathon fue mejorado en los siguientes aspectos:
21
+ <h4>El espacio demo:</h4>
22
+ -Refactor/Ajustes de integración con la base de datos vectorial Pinecone
23
+ -Pre-procesado e indexación de la propuesta de reforma pensional de Colombia de Marzo 2023
24
+ -Refactor UX y ajustes de usabilidad de la interfaz de usuario
25
+ -Ajustes de integración con OpenAI
26
+ -Pruebas con Sentence transformers usando texto en español
27
+ <h4>Modelos de lenguaje:</h4>
28
+ Fueron entrenados dos modelos Baizemocracy basados en LLaMA-7B con foco en aumentar generativamente las respuestas retornadas por los sentence transformers con el fin de hacerlo más conversacional usando modelos open source en español.
29
+ Los siguientes modelos fueron entrenados entrenados con un dataset construido durante la hackathon además de varios datasets orientados a Question answering y Chat.
30
+ -[hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa](https://huggingface.co/hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa): Esta variación del modelo es más enfocada en generar respuestas factuales dado un contexto basado en fuentes.
31
+ -[hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa-conv](https://huggingface.co/hackathon-somos-nlp-2023/baizemocracy-lora-7B-cfqa-conv): Esta variación del modelo tiene un estílo más conversacional para generar respuestas factuales dado un contexto basado en fuentes.
32
+ <h4>Datasets:</h4>
33
+ -[hackathon-somos-nlp-2023/ask2democracy-cfqa-salud-pension](https://huggingface.co/datasets/hackathon-somos-nlp-2023/ask2democracy-cfqa-salud-pension): Un datset de tipo instrucciones con respuestas a preguntas generadas a partir de en un contexto basado en fuentes.
34
+
35
+ Nota: Los modelos entrenados durante la hackathon requieren optimizaicón adicional para ser integrados en el pipeline de consulta.
36
+ Durante la hackathon se realizaron pruebas con tiempos de inferencia de alredecor de <70 segundos sobre CPU, lo que dificulta la usabilidad en el demo.
37
+ Futuras actualizaciones se esperan incorporar en el demo original del proyecto [espacio demo original del proyecto](https://huggingface.co/spaces/jorge-henao/ask2democracycol)
38
+
39
  <h2>¿Cómo utilizar este espacio?</h2>
40
  Selecciona el de documento que quieres explorar en el panel de la izquierda, escribe preguntas en la caja de texto y presiona el botón.
41
  No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta mejores resultados obtienes.