Gforce-ML commited on
Commit
0ce43c1
1 Parent(s): aad876c

remove project to community account

Browse files
Files changed (2) hide show
  1. app.py +48 -0
  2. requirements.txt +3 -0
app.py ADDED
@@ -0,0 +1,48 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import numpy as np
2
+ import pandas as pd
3
+ # import io
4
+ import streamlit as st
5
+ import streamlit.components.v1 as components
6
+
7
+ components.html(
8
+ """
9
+ <a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=Маруся+не+отвечает+на+реплики" alt="Typing SVG" /></a>
10
+ <a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=из+телевизора" alt="Typing SVG" /></a>
11
+ """
12
+ )
13
+
14
+ st.markdown("<h1 style='text-align: center;'>VK кейс Маруся <i>GrowAi</i></h1>", unsafe_allow_html=True)
15
+
16
+ with open("./image.jpg", "rb") as f:
17
+ st.image(f.read(), use_column_width=True)
18
+
19
+ with st.expander("ℹ️ - About this app", expanded=True):
20
+
21
+ st.write(
22
+ """
23
+ - Это приложение — это простой в использовании интерфейс, встроенный в специальную библиотеку Streamlit.
24
+ - Он использует метод минимального извлечения ключевых слов, который использует несколько вложений NLP и полагается на transformers.
25
+ """
26
+ )
27
+
28
+ st.write(
29
+ """
30
+ # Краткое описание решения
31
+ Мы представляем алгоритм машинного обучения для решения задачи бинарной классификации, отличающий команды пользователя голосового помощника VK "Маруся" от внешнего шума для повышения коммуникации.
32
+
33
+ Проанализировав входные данные нами было проведена комплексная оценка параметров признаков, в процессе подготовки было очищено порядка 1,5 тысяч диалогов, содержащих смайлики и пустые значения для лучшего распознавания команд алгоритмом, проставлена пунктуация в ключевых фразах и диалогах пользователей, дана оценка токсичности пользовательских ответов, качества данного ответа, а также лингвистическая приемлемость.
34
+
35
+ Стек решения:
36
+ python, torch, transformers, sklearn, scipy, pandas, numpy, streamlit
37
+
38
+ Уникальность:
39
+ Решение оформлено в виде web приложения с пользовательским интерфейсом, позволяющим загружать релевантные данные для их обработки разработанным алгоритмом. Интерпретируемость модели определяется извлечением отдельных признаков, имеющих наибольшую взаимосвязь и значимость для классификации. Повышение точности основано на подходе разделения дата сета на 5 частей для обучения отдельных моделей вместо 1.
40
+ """
41
+ )
42
+
43
+
44
+ st.title("Проверить работу алгоритма, можно через эту форму")
45
+ placeholder = st.empty()
46
+ text = placeholder.text_area("Вставьте или напишите текст", height=300)
47
+ button = st.button("ТЫК")
48
+
requirements.txt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ numpy
2
+ pandas
3
+ streamlit