Gforce-ML commited on
Commit
c1360de
1 Parent(s): 2d6275c

correct description

Browse files
Files changed (1) hide show
  1. app.py +14 -8
app.py CHANGED
@@ -68,31 +68,31 @@ with st.expander("Описание пайплайна работы", expanded=Tr
68
  st.write(
69
  """
70
  ### Этапы разработки
71
- <b><i>1. Поиск и сбор данных:</b></i>
72
  Был использован датасет из Тайваньского экономического журнала за период с 1999 по 2009 год. Банкротство компании было определено на основании правил ведения бизнеса Тайваньской фондовой биржи. (<a href="https://www.kaggle.com/datasets/fedesoriano/company-bankruptcy-prediction">Ссылка на данные</a>)
73
 
74
- <b><i>2. Обработка (препроцессинг):</b></i>
75
  Удаление ненужных колонок, one hot encoding категориальных переменных, заполнение пропущенных значений. С использованием библиотек pandas, numpy, seaborn.
76
 
77
- <b><i>3. Анализ статистических показателей и визуализация:</b></i>
78
  Инструменты для этого - с использованием библиотек pandas, seaborn.
79
 
80
- <b><i>4. Выбор моделей, обучение и валидация модели с ними (без фичей):</b></i>
81
  С использованием библиотек scikit-learn, pandas, seaborn.
82
 
83
- <b><i>5. Выбор моделей, обучение и валидация модели с ними (с фичами):</b></i>
84
  С использованием библиотек scikit-learn, pandas, seaborn.
85
  <
86
- b><i>6. Сравнение результатов:</b></i>
87
  Анализ и графическое представление работы алгоритмов. При некорректной работе или плохим результатом проводится п. 4 и п. 5.
88
 
89
- <b><i>7. Оформление микросервиса Streamlit:</b></i>
90
  С использованием библиотеки streamlit.
91
  """,
92
  unsafe_allow_html=True
93
  )
94
 
95
- with st.expander("Описание пайплайна работы", expanded=True):
96
 
97
  st.write(
98
  """
@@ -139,6 +139,9 @@ data = pd.read_csv("./dataset.csv", sep=",")
139
 
140
  st.write(""" ### Таблица с данными: """, data)
141
 
 
 
 
142
  st.write(
143
  """
144
  # 2. Обработка (препроцессинг)
@@ -183,6 +186,9 @@ st.code(
183
  """
184
  )
185
  st.text(data.info)
 
 
 
186
  st.write("""Поскольку пропущенных значений нет, мы можем перейти к анализу данных.""")
187
 
188
  # VISUALIZATIONS
 
68
  st.write(
69
  """
70
  ### Этапы разработки
71
+ <b><i>1. Поиск и сбор данных:</i></b>
72
  Был использован датасет из Тайваньского экономического журнала за период с 1999 по 2009 год. Банкротство компании было определено на основании правил ведения бизнеса Тайваньской фондовой биржи. (<a href="https://www.kaggle.com/datasets/fedesoriano/company-bankruptcy-prediction">Ссылка на данные</a>)
73
 
74
+ <b><i>2. Обработка (препроцессинг):</i></b>
75
  Удаление ненужных колонок, one hot encoding категориальных переменных, заполнение пропущенных значений. С использованием библиотек pandas, numpy, seaborn.
76
 
77
+ <b><i>3. Анализ статистических показателей и визуализация:</i></b>
78
  Инструменты для этого - с использованием библиотек pandas, seaborn.
79
 
80
+ <b><i>4. Выбор моделей, обучение и валидация модели с ними (без фичей):</i></b>
81
  С использованием библиотек scikit-learn, pandas, seaborn.
82
 
83
+ <b><i>5. Выбор моделей, обучение и валидация модели с ними (с фичами):</i></b>
84
  С использованием библиотек scikit-learn, pandas, seaborn.
85
  <
86
+ b><i>6. Сравнение результатов:</i></b>
87
  Анализ и графическое представление работы алгоритмов. При некорректной работе или плохим результатом проводится п. 4 и п. 5.
88
 
89
+ <b><i>7. Оформление микросервиса Streamlit:</i></b>
90
  С использованием библиотеки streamlit.
91
  """,
92
  unsafe_allow_html=True
93
  )
94
 
95
+ with st.expander("О применении машинного обучения", expanded=True):
96
 
97
  st.write(
98
  """
 
139
 
140
  st.write(""" ### Таблица с данными: """, data)
141
 
142
+ col_data = pd.read_csv("./col_description.csv", sep=",", header=None)
143
+ st.write(""" ### Описание признаков: """, col_data)
144
+
145
  st.write(
146
  """
147
  # 2. Обработка (препроцессинг)
 
186
  """
187
  )
188
  st.text(data.info)
189
+
190
+ st.text(pd.DataFrame(data=data.info()))
191
+
192
  st.write("""Поскольку пропущенных значений нет, мы можем перейти к анализу данных.""")
193
 
194
  # VISUALIZATIONS