File size: 8,414 Bytes
a12b663
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
d572422
 
a12b663
 
 
799c3b9
 
 
 
a12b663
 
 
799c3b9
a12b663
799c3b9
 
27281e4
14b7f61
 
27281e4
14b7f61
 
27281e4
14b7f61
 
27281e4
14b7f61
 
27281e4
14b7f61
 
27281e4
14b7f61
 
27281e4
14b7f61
 
 
 
 
 
 
 
 
799c3b9
14b7f61
 
 
 
 
 
 
 
799c3b9
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
#          imports
# ====================================

import numpy as np
import pandas as pd
import streamlit as st
import streamlit.components.v1 as components


components.html(
    """
        <a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=Анализ+банкротства+компании" alt="Typing SVG" /></a>
        <a href="https://git.io/typing-svg"><img src="https://readme-typing-svg.herokuapp.com?font=Fira+Code&pause=1000&width=435&lines=методами+искуственного+интеллекта" alt="Typing SVG" /></a>
    """
)

st.markdown("<h1 style='text-align: center;'>Применение методов машинного обучения в анализе банкротства</h1>", unsafe_allow_html=True)

with open("./img.png", "rb") as f:
    st.image(f.read(), use_column_width=True)

st.write(
    """
        # Краткое описание задачи
        Эффективное и заблаговременное прогнозирование банкротства компаний имеет важно значение для всех участников рынка. По мере развития информационного общества традиционные методы выявления банкротства становятся менее эффективными и более трудозатратными. Поэтому сочетание традиционных методов с современными моделями искусственного интеллекта может быть эффективно применено в современных экономических условиях. 
        
       Основная цель работы - оценить риск банкротства с помощью нескольких алгоритмов машинного обучения, сравнить результаты их работы, определить наилучшую модель и соответствующий набор признаков для прогнозирования банкротства компаний.    
    """
)

with st.expander("Описание пайплайна работы", expanded=True):

    st.write(
            """
                ## Этапы разработки
<b><i>1. Поиск и сбор данных:</b></i>
Был использован датасет из Тайваньского экономического журнала за период с 1999 по 2009 год. Банкротство компании было определено на основании правил ведения бизнеса Тайваньской фондовой биржи. (<a href="https://www.kaggle.com/datasets/fedesoriano/company-bankruptcy-prediction">Ссылка на данные</a>)

<b><i>2. Обработка (препроцессинг):</b></i>
Удаление ненужных колонок, one hot encoding категориальных переменных, заполнение пропущенных значений. С использованием библиотек pandas, numpy, seaborn.

<b><i>3. Анализ статистических показателей и визуализация:</b></i>
Инструменты для этого - с использованием библиотек pandas, seaborn.

<b><i>4. Выбор моделей, обучение и валидация модели с ними (без фичей):</b></i>
С использованием библиотек scikit-learn, pandas, seaborn.

<b><i>5. Выбор моделей, обучение и валидация модели с ними (с фичами):</b></i>
С использованием библиотек scikit-learn, pandas, seaborn.

<b><i>6. Сравнение результатов:</b></i>
Анализ и графическое представление работы алгоритмов. При некорректной работе или плохим результатом проводится п. 4 и п. 5.

<b><i>7. Оформление микросервиса Streamlit:</b></i>
С использованием библиотеки streamlit.
            """,
            unsafe_allow_html=True
        )

with st.expander("Описание пайплайна работы", expanded=True):

    st.write(
            """
               ## Информация о применении методов машинного обучения для бизнес-задач:
Прогнозирование финансовой  неустойчивости – важный  компонент управления  компанией.  Из-за банкротства акционеры теряют доходы, бизнес, нарушаются цепочки поставок, фискальные органы лишаются налоговых поступлений, госорганы фиксируют снижение экономического роста и повышение социальной напряженности, а работники вынуждены искать новую работу. Поэтому получение ясной картины  финансового  и имущественного  состояния компаний уже  много  лет  является  целью специалистов самых разных областей знаний.  

Компании активно внедряют современные технологии в основную деятельность, автоматизируя большое  количество  бизнес-процессов.  Это  позволяет  выстраивать,  например, электронную экспертизу,  c  помощью  которой  возможно  оперативно  объединять  множество  экспертов  из  разных предметных  областей  для  полного  охвата  рассматриваемой  проблемы  и  принятия  коллективного решения. Электронная экспертиза также подразумевает взаимодействие людей с интеллектуальными системами,  которые  способны  строить  анализ  и  прогнозы  на  основе  более  широкого  пространства переменных. Так, в частности, методы машинного обучения применяются уже в значительном количестве бизнес-задач, в том числе для интеллектуальной аналитики больших данных, которые компания аккумулирует для построения моделей прогнозирования.

Однако  риски  банкротства  могут  также  возникнуть  из-за некорректного  стратегического  менеджмента.  Такой  менеджмент  подразумевает  разработку долгосрочных  целей  и  действий,  которые  позволят  достичь  более  высоких  результатов  в  будущем, например, стать лидирующей компанией в своей отрасли. Разрабатываемые при этом стратегии обычно носят амбициозный характер, поэтому цели компании в таком случае не направлены на пролонгацию сложившейся  динамики.  Правильный  анализ  стратегической  ситуации  также  важен  для прогнозирования банкротства. Существует множество методов для ее оценки, в том числе и на основе анализа больших данных.<a href="http://infosoc.iis.ru/article/view/509">Источник<a>
            """,
            unsafe_allow_html=True
        )