Spaces:
Runtime error
Runtime error
import numpy as np | |
import pandas as pd | |
# import io | |
import streamlit as st | |
import streamlit.components.v1 as components | |
components.html( | |
""" | |
<a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=Маруся+не+отвечает+на+реплики" alt="Typing SVG" /></a> | |
<a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=из+телевизора" alt="Typing SVG" /></a> | |
""" | |
) | |
st.markdown("<h1 style='text-align: center;'>VK кейс Маруся <i>GrowAi</i></h1>", unsafe_allow_html=True) | |
with open("./image.jpg", "rb") as f: | |
st.image(f.read(), use_column_width=True) | |
with st.expander("ℹ️ - About this app", expanded=True): | |
st.write( | |
""" | |
- Это приложение — это простой в использовании интерфейс, встроенный в специальную библиотеку Streamlit. | |
- Он использует метод минимального извлечения ключевых слов, который использует несколько вложений NLP и полагается на transformers. | |
""" | |
) | |
st.write( | |
""" | |
# Краткое описание решения | |
Мы представляем алгоритм машинного обучения для решения задачи бинарной классификации, отличающий команды пользователя голосового помощника VK "Маруся" от внешнего шума для повышения коммуникации. | |
Проанализировав входные данные нами было проведена комплексная оценка параметров признаков, в процессе подготовки было очищено порядка 1,5 тысяч диалогов, содержащих смайлики и пустые значения для лучшего распознавания команд алгоритмом, проставлена пунктуация в ключевых фразах и диалогах пользователей, дана оценка токсичности пользовательских ответов, качества данного ответа, а также лингвистическая приемлемость. | |
Стек решения: | |
python, torch, transformers, sklearn, scipy, pandas, numpy, streamlit | |
Уникальность: | |
Решение оформлено в виде web приложения с пользовательским интерфейсом, позволяющим загружать релевантные данные для их обработки разработанным алгоритмом. Интерпретируемость модели определяется извлечением отдельных признаков, имеющих наибольшую взаимосвязь и значимость для классификации. Повышение точности основано на подходе разделения дата сета на 5 частей для обучения отдельных моделей вместо 1. | |
""" | |
) | |
st.title("Проверить работу алгоритма, можно через эту форму") | |
placeholder = st.empty() | |
text = placeholder.text_area("Вставьте или напишите текст", height=300) | |
button = st.button("ТЫК") | |