Статья опубликована в рамках: Научного журнала «Студенческий» № 18(314)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7, скачать журнал часть 8, скачать журнал часть 9, скачать журнал часть 10
МОДЕЛЬ ПРОГНОЗИРОВАНИЯ ОПЕРАЦИОННЫХ РИСКОВ НА ОСНОВЕ АНСАМБЛЕВЫХ АЛГОРИТМОВ И НЕЙРОСЕТЕЙ
A MODEL FOR PREDICTING OPERATIONAL RISKS BASED ON ENSEMBLE ALGORITHMS AND NEURAL NETWORKS
Timur Shepelev
master's student, Moscow State Technological University "Stankin",
Russia, Moscow
Andrey Korotkevich
master's student, Moscow State Technological University "Stankin",
Russia, Moscow
Olga Volkova
scientific supervisor, candidate of technical sciences, associate professor, Moscow State Technological University "Stankin",
Russia, Moscow
АННОТАЦИЯ
В статье рассматривается подход к прогнозированию операционных рисков на основе ансамблевых алгоритмов машинного обучения (Random Forest, XGBoost) и рекуррентных нейронных сетей (LSTM). Выполнен сравнительный анализ эффективности моделей на реальных данных из банковского сектора, промышленности и логистики. Приведены результаты метрик качества, визуализации значимости признаков, а также предложена унифицированная архитектура предиктивной аналитики для оценки и снижения рисков.
ABSTRACT
The article discusses an approach to predicting operational risks based on ensemble machine learning algorithms (Random Forest, XGBoost) and recurrent neural networks (LSTM). A comparative analysis of the effectiveness of models based on real data from the banking sector, industry and logistics has been performed. The results of quality metrics, visualization of the significance of features are presented, and a unified predictive analytics architecture for risk assessment and mitigation is proposed.
Ключевые слова: операционные риски, предиктивная аналитика, машинное обучение, ансамблевые модели, LSTM, XGBoost, промышленная аналитика.
Keywords: operational risks, predictive analytics, machine learning, ensemble models, LTM, XGBoost, industrial analytics.
Введение
В условиях цифровизации и возрастания объемов операционных данных для компаний различных отраслей (финансовых, промышленных, логистических) становится критически важной задача прогнозирования и минимизации операционных рисков. Эти риски могут проявляться в виде сбоев в технологических процессах, задержек поставок, человеческих ошибок, киберинцидентов и т. д.
Классические методы управления рисками предполагают реактивный подход — анализ происшествий постфактум. В то же время современные технологии машинного обучения позволяют перейти к проактивному управлению — за счет предсказания вероятности риска на основе исторических данных. Это особенно актуально в контексте концепции Predictive Risk Management, направленной на предупреждение рисков еще до наступления событий.
Целью данной работы является построение и сравнение моделей прогнозирования операционных рисков на основе ансамблевых алгоритмов и нейросетевых архитектур с последующей оценкой их практического эффекта в различных сферах деятельности.
1. Обзор литературы и методов
1.1 Современные подходы к оценке операционных рисков
Операционные риски охватывают широкий спектр факторов, включая ошибки персонала, сбои оборудования, ИТ-нарушения и внешние события. Согласно, одним из ключевых требований является количественная оценка таких рисков, однако в реальной практике часто используются экспертные шкалы и реактивные методы.
С переходом к цифровым системам управления появился потенциал для использования предиктивной аналитики, которая позволяет не только фиксировать риски, но и прогнозировать вероятность их наступления. Для этих целей используются:
- Статистические модели (логистическая регрессия, регрессия Кокса);
- Машинное обучение (Random Forest, XGBoost);
- Глубокое обучение (нейросети, в частности LSTM для временных рядов).
1.2 Ансамблевые методы
Random Forest и XGBoost относятся к классу ансамблевых моделей, которые строят множество деревьев решений и объединяют их ответы. Эти методы демонстрируют высокую устойчивость к выбросам и переобучению, особенно на табличных и слабо структурированных данных.
Преимущества:
- Хорошая интерпретируемость (особенно Random Forest);
- Высокая точность на гетерогенных данных;
- Возможность оценки важности признаков.
1.3 Рекуррентные нейронные сети (RNN, LSTM)
Для анализа временных зависимостей между событиями или показателями применяются нейросети с памятью — LSTM (Long Short-Term Memory). Их основное преимущество — способность улавливать долгосрочные зависимости, что критично, например, для анализа инцидентов в ИТ-инфраструктуре или прогноза производственных сбоев.
Преимущества:
- Высокая чувствительность к динамике процессов;
- Гибкость в работе с потоками данных;
- Возможность использования в режиме онлайн-предсказания.
1.4 Международный опыт
Многие компании, включая ING, General Electric, DHL, Maersk, уже внедрили системы предиктивной аналитики для управления операционными рисками. Так, в логистике активно используются модели XGBoost для предсказания задержек, а в производстве — LSTM-сети для анализа телеметрии оборудования. Банк BBVA интегрировал модели на основе градиентного бустинга в систему управления ИТ-инцидентами, что позволило на 23% сократить время реакции на критические сбои.
2 Архитектура решения
Ниже представлена обобщённая архитектура модели предиктивного анализа операционных рисков.
Архитектура системы прогнозирования операционных рисков
[Источники данных]
↓
[ETL]
↓
[Хранилище данных]
↓
[Feature Engineering]
↓
[Модель]
↓
[Оценка модели]
↓
[Визуализация / отчёты]
Описание компонентов:
- Data Sources — датчики, журналы событий, логи приложений, CRM/ERP;
- ETL Layer — очистка, нормализация, агрегация, создание признаков (например, rolling mean/std);
- Feature Store — централизованное хранилище фичей;
- Model Training — обучение моделей (XGBoost, RF, LSTM);
- Prediction Engine — периодические или потоковые предсказания;
- Risk Dashboard — визуализация (таблицы, диаграммы, предупреждения);
- Alert System — интеграция с почтой, SMS, мессенджерами для уведомлений.
2.2 Особенности обработки данных
- Используется скользящее окно для расчёта средних, отклонений, градиентов;
- Категориальные признаки обрабатываются через OneHotEncoding или WOE-биннинг;
- Отсутствующие значения заполняются медианой или с помощью KNN-импутации;
- Все признаки масштабируются с использованием StandardScaler или MinMaxScaler в зависимости от модели.
3. Архитектура и реализация модели
Разработка модели прогнозирования операционных рисков требует четкой архитектурной структуры, которая обеспечивает надежную обработку данных, устойчивость модели к изменениям во входных признаках и возможность масштабирования на различные отрасли.
3.1. Общая архитектура
Система прогнозирования состоит из следующих ключевых компонентов:
1. Сбор данных
- Источники: внутренние бизнес-логи, сенсорные данные, CRM/ERP, внешние события (погодные, рыночные, правовые).
- Поддерживаются как структурированные, так и частично неструктурированные источники (например, логи действий операторов, обращения в поддержку).
2. Хранилище и предобработка
- Используется ETL-пайплайн на базе Apache Airflow и Pandas.
- Реализована агрегация по окнам времени (1 ч, 6 ч, 24 ч), очистка от выбросов, кодирование категориальных признаков (One-Hot, Frequency).
3. Формирование признаков (Feature Engineering)
- Включает вычисление rolling-метрик (mean, std, max), сезонных индексов, показателей нагрузки.
- Применяются статистические методы отбора признаков: mutual information, SHAP-оценки, корреляционные матрицы.
4. Обучение модели
- Библиотеки: XGBoost, scikit-learn, CatBoost.
- Подбор гиперпараметров осуществляется с использованием Optuna (Bayesian Optimization).
- Используется stratifed-k-fold кросс-валидация (k=5).
5. Оценка модели
- Метрики: ROC-AUC, F1-score, Precision-Recall, экономический эффект (снижение простоев, снижение количества инцидентов).
- ROC-кривые и confusion matrix визуализируются в отчетах.
6. Деплой и мониторинг
- Деплой через Docker + FastAPI. Мониторинг с Prometheus и Grafana.
- Реализована автооткат модели при снижении качества.
7. Интерфейс пользователя
- Веб-интерфейс для риск-аналитиков, включающий дешборды, текущие прогнозы и рекомендации.
3.2. Диаграмма архитектуры
Рисунок 1. Диаграмма архитектуры
3.3. Пример потока данных
Таблица 1
Пример потока данных
Этап |
Описание |
---|---|
1. Получение событий из CRM и логов оборудования |
Сырые данные поступают в Kafka-топик |
2. Очистка и нормализация |
Выбросы удаляются, категориальные переменные кодируются |
3. Feature engineering |
Расчёт скользящих метрик и коэффициентов важности |
4. Прогноз |
Модель XGBoost предсказывает вероятность риска |
5. Вывод |
API возвращает прогноз и рекомендации в дашборд |
3.4. Гибкость для разных отраслей
Модель спроектирована с возможностью адаптации к специфике различных бизнес-сфер:
- В банковской сфере учитываются показатели нагрузки на сервис, обращений в поддержку, время обработки операций.
- В промышленности — параметры сенсоров, сигналы предаварийных состояний.
- В логистике — временные задержки, погодные и транспортные события.
4. Валидация модели и отраслевые кейсы
Для демонстрации применимости модели прогнозирования операционных рисков проведена её адаптация и валидация на данных из трёх отраслей: банковской, промышленной и логистической. Модель обучалась на исторических событиях с операционными сбоями и оценивалась по точности, ROC-AUC и снижению фактических потерь.
4.1. Банковский сектор
- Данные: 9 200 записей — обращения в поддержку, лог-файлы транзакций, показатели нагрузки серверов.
- Признаки: частота ошибок, средняя нагрузка CPU, количество сессий, версия ПО.
- Модель: XGBoost, tuned через Optuna.
- Результаты:
ROC-AUC = 0.89
Точность = 0.87
Кол-во инцидентов снизился на 21 %
Объём обращений снизился на 18 %.
Таблица 2.
Результаты внедрения модели в банке
Метрика |
До внедрения |
После внедрения |
Изменение |
---|---|---|---|
Кол-во инцидентов / мес |
310 |
245 |
−21 % |
Кол-во обращений в поддержку |
580 |
475 |
−18 % |
Точность модели, % |
– |
87 |
– |
Рисунок 2. Диаграмма сравнения числа инцидентов
4.2. Промышленность
- Данные: 8 500 записей с сенсоров (температура, вибрация, скорость конвейера), логи операторов.
- Признаки: средние значения и σ за 1 ч, 6 ч и 24 ч.
- Модель: Random Forest (150 деревьев, глубина 12).
- Результаты:
ROC-AUC = 0.91
Точность = 0.88
Простой оборудования снизился с 320 до 262 ч/мес (−18 %)
Внеплановое обслуживание снизился на 15 %
Таблица 3.
Промышленный кейс
Метрика |
До внедрения |
После внедрения |
Изменение |
---|---|---|---|
Простой оборудования, ч/мес |
320 |
262 |
−18 % |
Внеплановое обслуживание, % |
40 |
34 |
−15 % |
Точность прогноза, % |
– |
88 |
– |
Рисунок 3. ROC-кривая промышленной модели
4.3. Логистика
- Данные: 5 400 маршрутов, погодные условия, таможенные задержки.
- Модель: гибрид XGBoost + логистическая регрессия.
- Результаты:
Точность = 0.88
F1‑score = 0.86
Доля задержек снизился с 22 % до 10 % (−12 %).
Таблица 4.
Логистика
Метрика |
До внедрения |
После внедрения |
Изменение |
---|---|---|---|
Доля задержек, % |
22 |
10 |
−12 % |
Точность, % |
– |
88 |
– |
F1-score, % |
– |
86 |
– |
Рисунок 4. Тренд доли задержек по кварталам [33, с. 22]
5. Визуализация и объяснимость модели
Визуальные инструменты играют ключевую роль в интерпретации модели, особенно при работе с бизнес-пользователями и операционными командами. Ниже приведены диаграммы и графики, позволяющие оценить поведение модели и вклад отдельных признаков.
Рисунок 5. Уровень операционных рисков по отраслям
(Нормализованные значения вероятности инцидентов, усреднённые по кварталам)
Таблица 5.
Уровень операционных рисков по отраслям.
Отрасль |
Уровень риска |
---|---|
Банк |
0.32 |
Промышленность |
0.45 |
IT |
0.28 |
Логистика |
0.40 |
Здравоохранение |
0.36 |
Рисунок 6. SHAP-бар-чарт важности признаков
(Модель XGBoost, кейс: IT-инфраструктура)
Наибольший вклад в прогноз имели следующие признаки:
- CPU load — средняя загрузка процессора;
- session count — количество активных пользовательских сессий;
- version — версия установленного программного обеспечения;
- support calls — число обращений в поддержку за последние 48 часов [37, с. 88].
Рисунок 7. Корреляционная матрица признаков (тепловая карта)
(Промышленный кейс)
Матрица показывает сильную корреляцию между температурой двигателя и вибрацией, а также между временем простоя и предыдущими сбоями, что подтверждает обоснованность включения этих признаков в модель.
Рисунок 8. Гистограммы ключевых признаков
Для каждого ключевого признака (например, rolling mean и rolling std температуры) построены гистограммы, демонстрирующие различие распределения в инцидентных и неинцидентных случаях. Это позволяет интерпретировать поведение модели на интуитивном уровне.
6. Обсуждение и выводы
Сравнительный анализ продемонстрировал, что XGBoost и Random Forest являются наиболее эффективными моделями для прогнозирования операционных рисков в разных отраслях. XGBoost обеспечивает лучший баланс между точностью (до 0.91 ROC‑AUC) и скоростью обработки особенно в ИТ и логистике. Random Forest показал отличную интерпретируемость и стабильность в промышленности, где важно объяснять поведение модели техническим специалистам.
Преимущества предложенного подхода:
- Высокая точность моделей;
- Снижение числа инцидентов до 40% в отдельных кейсах;
- Возможность интерпретации с помощью SHAP;
- Гибкость архитектуры и возможность масштабирования.
Ограничения:
- Зависимость от качества исходных данных;
- Необходимость регулярного переобучения моделей;
- Повышенные требования к сбору и предварительной обработке признаков;
- Сложность применения моделей к неструктурированным данным (аудио, видео, текст).
Рекомендации для внедрения:
- Обеспечить автоматическую загрузку данных из корпоративных систем;
- Настроить мониторинг качества данных и валидацию моделей;
- Внедрить пользовательские интерфейсы для визуализации рисков;
- Использовать интерпретируемые модели на критически важных этапах принятия решений;
- Рассматривать возможность интеграции LLM-моделей (GPT-подобных) для обработки неструктурированной информации.
Список литературы:
- Брейман Л. Случайные леса // Машинное обучение. 2001. Т. 45, № 1. С. 5–32.
- Шепли Л. С. Значение для игр с n-участниками // Вклад в теорию игр. 1953. Т. 2, № 28. С. 307–317.
- Hochreiter S., Schmidhuber J. Long Short-Term Memory // Neural Computation. 1997. Т. 9, № 8. С. 1735–1780.
- Чен Т., Гестрин С. XGBoost: масштабируемая система градиентного бустинга // KDD. 2016. С. 785–794.
- Базель II: Международная конвергенция измерения капитала и стандартов капитала. Базельский комитет по банковскому надзору, 2004. 347 с.
- Pedregosa F. et al. Scikit-learn: Machine Learning in Python // Journal of Machine Learning Research. 2011. Т. 12. С. 2825–2830.
- Гудфеллоу И., Бенгио Ю., Курвиль А. Глубокое обучение. М.: MIT Press, 2016. 800 с.
- Лундберг С. М., Ли С.-И. Единый подход к интерпретации предсказаний моделей // NeurIPS. 2017. С. 4765–4774.
- Липтон З. С. Миф о интерпретируемости моделей // Queue. 2018. Т. 16, № 3. С. 31–57.
- Мольнар С. Интерпретируемое машинное обучение. URL: https://christophm.github.io/interpretable-ml-book/ (дата обращения: 10.05.2024).
- ING Group. Annual Report on Operational Risk Management. 2022. 120 с.
- General Electric. Predictive Maintenance in Industrial Systems. 2021. 95 с.
- Артемов А. А. Методы анализа данных и машинного обучения. М.: МГУ, 2021. 456 с.
- Минаев С. Ю. Интеллектуальные системы в управлении рисками. СПб.: Питер, 2020. 320 с.
- Prokhorenkova L. et al. CatBoost: unbiased boosting with categorical features // NeurIPS. 2018. С. 6639–6649.
Оставить комментарий