Spaces:
Runtime error
Runtime error
remove project to community account
Browse files- app.py +48 -0
- requirements.txt +3 -0
app.py
ADDED
@@ -0,0 +1,48 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
import numpy as np
|
2 |
+
import pandas as pd
|
3 |
+
# import io
|
4 |
+
import streamlit as st
|
5 |
+
import streamlit.components.v1 as components
|
6 |
+
|
7 |
+
components.html(
|
8 |
+
"""
|
9 |
+
<a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=Маруся+не+отвечает+на+реплики" alt="Typing SVG" /></a>
|
10 |
+
<a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=из+телевизора" alt="Typing SVG" /></a>
|
11 |
+
"""
|
12 |
+
)
|
13 |
+
|
14 |
+
st.markdown("<h1 style='text-align: center;'>VK кейс Маруся <i>GrowAi</i></h1>", unsafe_allow_html=True)
|
15 |
+
|
16 |
+
with open("./image.jpg", "rb") as f:
|
17 |
+
st.image(f.read(), use_column_width=True)
|
18 |
+
|
19 |
+
with st.expander("ℹ️ - About this app", expanded=True):
|
20 |
+
|
21 |
+
st.write(
|
22 |
+
"""
|
23 |
+
- Это приложение — это простой в использовании интерфейс, встроенный в специальную библиотеку Streamlit.
|
24 |
+
- Он использует метод минимального извлечения ключевых слов, который использует несколько вложений NLP и полагается на transformers.
|
25 |
+
"""
|
26 |
+
)
|
27 |
+
|
28 |
+
st.write(
|
29 |
+
"""
|
30 |
+
# Краткое описание решения
|
31 |
+
Мы представляем алгоритм машинного обучения для решения задачи бинарной классификации, отличающий команды пользователя голосового помощника VK "Маруся" от внешнего шума для повышения коммуникации.
|
32 |
+
|
33 |
+
Проанализировав входные данные нами было проведена комплексная оценка параметров признаков, в процессе подготовки было очищено порядка 1,5 тысяч диалогов, содержащих смайлики и пустые значения для лучшего распознавания команд алгоритмом, проставлена пунктуация в ключевых фразах и диалогах пользователей, дана оценка токсичности пользовательских ответов, качества данного ответа, а также лингвистическая приемлемость.
|
34 |
+
|
35 |
+
Стек решения:
|
36 |
+
python, torch, transformers, sklearn, scipy, pandas, numpy, streamlit
|
37 |
+
|
38 |
+
Уникальность:
|
39 |
+
Решение оформлено в виде web приложения с пользовательским интерфейсом, позволяющим загружать релевантные данные для их обработки разработанным алгоритмом. Интерпретируемость модели определяется извлечением отдельных признаков, имеющих наибольшую взаимосвязь и значимость для классификации. Повышение точности основано на подходе разделения дата сета на 5 частей для обучения отдельных моделей вместо 1.
|
40 |
+
"""
|
41 |
+
)
|
42 |
+
|
43 |
+
|
44 |
+
st.title("Проверить работу алгоритма, можно через эту форму")
|
45 |
+
placeholder = st.empty()
|
46 |
+
text = placeholder.text_area("Вставьте или напишите текст", height=300)
|
47 |
+
button = st.button("ТЫК")
|
48 |
+
|
requirements.txt
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
numpy
|
2 |
+
pandas
|
3 |
+
streamlit
|