Jorge Henao commited on
Commit
510f1e9
·
1 Parent(s): df17e37

description update

Browse files
Files changed (1) hide show
  1. about.py +15 -11
about.py CHANGED
@@ -5,28 +5,32 @@ def show_about_ask2democracy():
5
  description = """
6
  <h2>Sobre esta iniciativa</h2>
7
  <p>Muchas de las discusiones que ocurren en Colombia generalmente están sustentadas en artículos o pdfs que salvo pocas excepciones, casi nadie lee.
8
- En este demo se han indexado algunos textos relevantes para la discución pública que suelen estar dispersos y poco accesibles, además, apoyandose en modelos de lenguaje Transformers (abajo más detalles) puede entender preguntas elaboradas.
9
- Algunos de los textos indexados: las propuestas presidenciales del 22, los hallazgos de la comisión de la verdad, los textos de las reformas, entre otros.
 
 
 
10
  <div align="right">
11
  Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a href="https://www.linkedin.com/in/henaojorge" target='_blank'/>LinkedIn</a>
12
  </div>
13
  <p>
14
  <h2>¿Cómo utilizar este espacio?</h2>
15
- Selecciona la colección de documentos sobre la que quieres buscar en el panel de la izquierda y escribe preguntas.
16
  No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta mejores resultados se obtienen.
17
  <h2>Integración opcional con OpenAI</h2>
18
- Este espacio usa recursos de computo de Hugging Face y una base de datos vectorial Pinecone sin costo para el usuario. De manera opcional, si tienes una cuenta en OpenAI también puedes activar la integración copiando tu API key en el panel de la izquierda.
19
- Una vez ingreses el api key, cada vez que preguntes el sistema la usará para generar una respuesta a partir de los resultados de búsqueda obtenidos.
20
- También puedes configurar la temperatura y la cantidad de tokens.
 
21
  <p><p><b>Nota:El sistema no guarda tu API key, la utiliza para aumentar tus consultas mientras lo uses.</b>
22
  <h2>Inteligencia artificial y democracia</h2>
23
  Pretende ayudar a construir democracia participativa apaloncándose en el estado del arte de la inteligencia artificial.
24
- Siendo una herramienta que aporta a la discución pública, empoderando al ciudadano del común para ser partícipe del debate público mientras hace preguntas en su propio lenguaje, y llegando a sus propias conclusiones.
25
  <p>
26
- Uno de los objetivos es contribuir a la inteligencia artificial abierta y en español, con la construcción de un dataset y el entrenamiento de un modelo de lenguaje adaptado para las discuciones ciudadanas.
27
  Algo útil para elevar la calidad del debate en todos los países de habla hispana.
28
  <h2>Ask2Democracy v 1.2</h2>
29
- Esta version usa sentence transformers, Cosine similarity, <a href= "https://github.com/deepset-ai/haystack">Haystack framework</a> y una base de dactos vectorial Pinecone para mejorar la precision en las respuestas.
30
  Los modelos transformers de lenguaje utilizados son:
31
  <code>
32
  sentence-transformers/multi-qa-MiniLM-L6-cos-v1
@@ -34,8 +38,8 @@ deepset/xlm-roberta-base-squad2-distilled
34
  </code>
35
  <a href= "https://github.com/jorge-henao/ask_to_democracy"> repo en github con FastAPI</a>
36
  <h2>Beta disclaimer</h2>
37
- Las respuestas que arroja el sistema no han sido pregrabadas ni basadas en opiniones. Todas son respuestas extraídas de fuentes oficiales, como el Informe final de la CEV.
38
- Este explorador usa modelos de lenguaje para entender el lenguaje español, sin embargo, necesita de un mayor entrenamiento por lo que, en ocasiones, puede ser confuso y no tan preciso.
39
  Si quieres apoyar escríbeme a <a href="mailto:[email protected]">[email protected]</a>
40
  </p>
41
  """
 
5
  description = """
6
  <h2>Sobre esta iniciativa</h2>
7
  <p>Muchas de las discusiones que ocurren en Colombia generalmente están sustentadas en artículos o pdfs que salvo pocas excepciones, casi nadie lee.
8
+ En este demo se han indexado algunos textos relevantes para la discución pública que suelen estar dispersos y poco accesibles. Además, apoyandose en el estado de del arte de la inteligencia artificial (abajo más detalles), puede entender preguntas elaboradas en español.
9
+ Parte del aporte con esta iniciativa también pretende ser la construcción de un dataset SQuAD en español. Dataset usado para entrenar(fine-tunning) uno o más modelos(Bert/GPT-2/Apalaca) adapatado a discuciones ciudadanas en español.
10
+ Algo que puede ayudar a elevar el nivel del debate público en paises de habla hispana.
11
+ <p>
12
+ Textos indexados: Propuesta reforma de la salud febrero 2023 , Capítulo de hallazgos y recomendaciones de la comisión de la verdad (trabajo en progreso, si quieres apoyar escríbeme)
13
  <div align="right">
14
  Creado por Jorge Henao 🇨🇴 <a href="https://twitter.com/jhenaotw" target='_blank'>Twitter</a> <a href="https://www.linkedin.com/in/henaojorge" target='_blank'/>LinkedIn</a>
15
  </div>
16
  <p>
17
  <h2>¿Cómo utilizar este espacio?</h2>
18
+ Selecciona la colección de documentos sobre la que quieres buscar en el panel de la izquierda, escribe preguntas en la caja de texto y presiona el botón.
19
  No se trata de un sistema de búsquedas basado en palabras clave, por el contrario, puedes redactar preguntas más extensas y elaboradas. Cuanto más contexto le des a la pregunta mejores resultados se obtienen.
20
  <h2>Integración opcional con OpenAI</h2>
21
+ Este demo usa recursos de computo limitados de Hugging Face y una base de datos vectorial Pinecone sin costo para la gente (si quieres ayudar a que sea más rápido ecríbeme).
22
+ De manera opcional, si tienes una cuenta en OpenAI también puedes activar la integración copiando tu API key en el panel de la izquierda.
23
+ Una vez ingreses el api key, cada vez que hagas una pregunta el sistema la usará para elaborar una respuesta breve a partir de los resultados de búsqueda obtenidos, basándose siempre en las fuentes oficiales.
24
+ También puedes configurar que tan larga quieres que sea la respuesta (max tokens), y que tan creativas (temperatura).
25
  <p><p><b>Nota:El sistema no guarda tu API key, la utiliza para aumentar tus consultas mientras lo uses.</b>
26
  <h2>Inteligencia artificial y democracia</h2>
27
  Pretende ayudar a construir democracia participativa apaloncándose en el estado del arte de la inteligencia artificial.
28
+ Al ser un demo accesible puede ayudar al ciudadano del común a tener opiniones más informadas, ayudándole a ser partícipe del debate público haciendo preguntas en su propio lenguaje, y llegando a sus propias conclusiones.
29
  <p>
30
+ El segundo objetivo es contribuir a la inteligencia artificial abierta y en español, con la construcción de un dataset y el entrenamiento de un modelo de lenguaje adaptado para las discuciones ciudadanas.
31
  Algo útil para elevar la calidad del debate en todos los países de habla hispana.
32
  <h2>Ask2Democracy v 1.2</h2>
33
+ Esta version usa sentence transformers (Cosine similarity), una base de dactos vectorial Pinecone para almacenar los embeddings, <a href= "https://github.com/deepset-ai/haystack">Haystack framework</a> y la integración con OpenAI.
34
  Los modelos transformers de lenguaje utilizados son:
35
  <code>
36
  sentence-transformers/multi-qa-MiniLM-L6-cos-v1
 
38
  </code>
39
  <a href= "https://github.com/jorge-henao/ask_to_democracy"> repo en github con FastAPI</a>
40
  <h2>Beta disclaimer</h2>
41
+ Las respuestas que arroja el sistema no han sido pregrabadas ni basadas en opiniones. Todas son respuestas extraídas de fuentes oficiales.
42
+ Este demo usa modelos de lenguaje para entender el lenguaje español, sin embargo, necesita de un mayor entrenamiento por lo que, en ocasiones, puede ser confuso y no tan preciso.
43
  Si quieres apoyar escríbeme a <a href="mailto:[email protected]">[email protected]</a>
44
  </p>
45
  """