Статья опубликована в рамках: CV Международной научно-практической конференции «Актуальные вопросы экономических наук и современного менеджмента» (Россия, г. Новосибирск, 06 апреля 2026 г.)
Наука: Экономика
Секция: Теория управления экономическими системами
Скачать книгу(-и): Сборник статей конференции
дипломов
МАШИННОЕ ОБУЧЕНИЕ И СТОХАСТИЧЕСКАЯ ОПТИМИЗАЦИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В ЭКОНОМИКЕ
MACHINE LEARNING AND STOCHASTIC OPTIMIZATION OF MANAGEMENT DECISIONS IN ECONOMICS
Lubin Nikolai Konstantinovich
Postgraduate student, Moscow University "Synergy",
Russia, Moscow
АННОТАЦИЯ
Цель — теоретическое обоснование подхода к принятию управленческих решений в экономических системах на основе интеграции методов машинного обучения и стохастической оптимизации. Методы: теоретический анализ, сравнительный анализ, обобщение научных подходов, систематизация моделей. Результат: сформировано представление о принятии управленческих решений, основанном на непрерывном обновлении параметров и учёте изменчивости экономической среды. Выводы: а) интеграция оценки параметров и выбора решения обеспечивает более точное согласование управленческих действий с текущим состоянием экономической системы; б) применимость модели для практики управления определяют свойства устойчивости, адаптивности, сходимости и чувствительности; в) развитие моделей связано с усилением их способности учитывать неопределённость и динамику данных в процессе принятия управленческих решений.
ABSTRACT
Background — theoretical substantiation of an approach to managerial decision-making in economic systems based on integration of machine learning methods and stochastic optimization. Methods: theoretical analysis, comparative analysis, synthesis of scientific approaches, systematization of models. Result: conceptualization of managerial decision-making based on continuous parameter updating and consideration of variability of economic environment. Conclusions: a) integration of parameter estimation and decision selection ensures more accurate alignment of managerial actions with current state of economic system; b) applicability of the model in practice is determined by properties of stability, adaptability, convergence, and sensitivity; c) further development of models is associated with enhanced ability to account for uncertainty and data dynamics in decision-making processes.
Ключевые слова: машинное обучение; стохастическая оптимизация; управленческие решения; экономические системы; принятие решений в реальном времени.
Keywords: machine learning; stochastic optimization; managerial decision-making; economic systems; real-time decision-making.
Управленческие решения в экономике формируются в среде, для которой характерны неполнота информации, изменчивость параметров и разрывы во временных рядах наблюдений, что актуализирует релевантность задачи стохастической оптимизации, ориентированной на работу с вероятностными оценками состояний системы [1]. Потоки данных в экономических системах поступают неравномерно, пересматриваются и дополняются, в связи с чем статические модели утрачивают возможности объяснения экономических процессов уже на этапе текущей оценки экономической динамики [2]. Вместе с тем расширение массивов наблюдений и появление высокочастотных индикаторов формируют возможность более точного восстановления текущего состояния экономики в реальном времени, однако сама процедура оценки имеет характер непрерывного обновления параметров и пересчёта прогнозов [3]. В этих условиях управленческое решение рассматривается как последовательность взаимосвязанных действий, зависящих от эволюции информации и структуры неопределённости, что усиливает роль методов, способных учитывать вероятностные сценарии и корректировать траекторию управления экономической системой по мере поступления новых данных [4].
Развитие методов машинного обучения усиливает аналитический потенциал стохастической оптимизации за счет расширения возможности работы с высокоразмерными пространствами признаков, нелинейными зависимостями и изменяющимися параметрами экономических систем [5]. В задачах динамического выбора большое значение имеют подходы, основанные на последовательном обучении и учёте накопленного опыта, в рамках которых управленческое решение определяется как функция состояния системы и ожидаемого выигрыша на горизонте будущих периодов [6]. При этом практическая значимость таких методов проявляется в способности объединять оценку параметров и выбор действия в единой процедуре, ориентированной на достижение целевых показателей функционирования системы [7]. Введение адаптивных алгоритмов, способных обновлять модели в процессе эксплуатации, позволяет повысить согласованность решений с фактической динамикой экономической среды и снизить влияние ошибочных предпосылок, неизбежных в условиях неопределённости и структурных сдвигов [8]. В связи с чем актуальность исследования определяется необходимостью развития математических и компьютерных средств анализа и оптимизации управленческих решений в экономических системах, функционирующих в условиях неопределённости и непрерывного обновления данных.
Стохастическая оптимизация управленческих решений формируется как развитие классических задач оптимального управления в условиях неопределённости, в которых состояние системы и параметры среды заданы распределением вероятностей и сценарии их изменения во времени [9]. В рамках экономических систем это выражается в необходимости учитывать воздействие шоков, разрывов динамики и смены траекторий развития [10]. Теоретическая база стохастической оптимизации опирается на постановки задач с последовательным принятием решений, в которых выбор определяется текущим состоянием системы, доступной информацией и ожиданием будущих эффектов, что сближает экономические задачи с классом марковских процессов принятия решений и динамического программирования [6]. В этой логике управленческое решение рассматривается как функция развития системы, тогда как критерий оптимальности имеет форму максимизации совокупного результата на горизонте будущих состояний [1]. Кроме того, важен учет неопределённости параметров, включая их изменчивость во времени [7].
Роль машинного обучения в данной теоретической области связана с возможностью перехода от заданных параметров к их оценке на основе данных, что расширяет область применимости стохастической оптимизации в условиях сложных и слабо формализуемых экономических процессов [5]. Машинное обучение вводит в модель механизм непрерывного обновления знаний о системе, что позволяет учитывать новые наблюдения, выявлять скрытые зависимости и уточнять структуру функции решения без необходимости жёсткой предварительной спецификации [4]. В задачах реального времени это проявляется в совмещении процедур оценки состояния и выбора действия, что обеспечивает согласование решений с текущей динамикой данных и снижает зависимость от априорных допущений [8]. В частности, при работе с высокоразмерными наборами признаков и потоками информации машинное обучение позволяет строить комбинированные модели, объединяющие статистические и вычислительные методы, что усиливает точность оценки и устойчивость решения к пересмотру входных данных [2]. В совокупности это формирует теоретическую основу интеграции стохастической оптимизации и методов машинного обучения в задачах управления экономическими системами, в рамках которой выбор решения определяется как результат непрерывного взаимодействия модели, данных и критериев эффективности [3].
Среди моделей машинного обучения, применяемых в задачах оптимизации в области управления экономическими системами, заметное место занимают регрессионные и комбинированные модели, ориентированные на оценку текущего состояния системы и на последующий выбор действия. Так, у Т. Кима и коллег сопоставлены опорная векторная регрессия, простая глубокая нейронная сеть и глубокая нейронная сеть, после чего лучшая модель переводится в формат последовательного обновления параметров [8]. В работе П. Форнаро и Х. Луомаранта используются комбинации статистических моделей и методов машинного обучения для оперативной оценки месячной и квартальной экономической активности, вследствие чего модельный блок служит информационной базой для последующего выбора управленческого решения [3]. У А. Ричардсона и коллег сопоставляются усиленные деревья (boosted trees), регрессию с использованием метода опорных векторов (support vector machine regression), нейронные сети и факторная модель в задаче оперативной оценки валового продукта, при этом машинное обучение отражает преимущество над традиционными бенчмарками в режиме реального времени [2]. В статье В. В. Вьюгина, В. К. Калмыкова и В. Г. Трунова представлены агрегирующие алгоритмы экспертных прогнозов и нейросетевые модели непрерывного обучения, применимые для потока данных с изменяющейся природой источника [4]. У В. Л. Берсенёва и О. Н. Бучинской в задаче диагностики шокового состояния экономики используются дерево решений и модель AdaBoost, что показывает значимость классификационных моделей для распознавания состояний экономической системы перед выбором управленческого воздействия [10].
Для собственно оптимизационных задач наибольший интерес представляют модели, в которых машинное обучение включается в процедуру выбора управленческого решения. В частности, у И. Чэня и И. Чжоу предложена схема, объединяющая оценку неизвестных переменных параметров на основе данных и модельно-предиктивное управление, вследствие чего управленческое решение связывается с текущим состоянием системы и целевыми показателями её функционирования [7]. У З. Чжана и коллег нейронная сеть сочетается с моделью первого принципа в задачах оптимизации в реальном времени и модель прогнозирующего управления, что особенно важно для теории управления экономическими системами, когда одна часть зависимостей известна заранее, другая — подлежит оценке по данным [9]. У С. Джаймунгала и коллег центральное место занимают модели обучения с подкреплением, многорукие бандиты (англ. multi-armed bandit), функции ценности и марковские процессы принятия решений, т.е. вычислительные конструкции, переводящие машинное обучение в область последовательного выбора действия при случайной динамике среды [1]. В работе Т. Ермолиевой и коллег машинное обучение связывается с двухэтапной стохастической оптимизацией, квантильной регрессией и стохастическими квазиградиентными алгоритмами, что расширяет круг моделей за пределы классических нейросетевых и регрессионных схем и актуализирует риск-ориентированный выбор управленческого решения [5].
В целом, можно обобщить рассмотренные модели машинного обучения в задачах стохастической оптимизации (табл. 1).
Таблица 1.
Сравнительная характеристика моделей машинного обучения в задачах стохастической оптимизации
|
Модель МО |
Объект оценки |
Тип задачи |
Учет неопределённости |
|
Регрессионные модели |
Показатель, параметр |
Прогноз, оценка состояния |
Ошибка прогноза, изменчивость данных |
|
Деревья решений, ансамбли |
Класс состояния, фактор |
Диагностика, выбор альтернативы |
Пороговые переходы, сдвиги |
|
Нейронные сети |
Нелинейная зависимость |
Прогноз, выявление структуры |
Высокая размерность, динамика |
|
Непрерывное обучение |
Параметры, поток данных |
Адаптация, обновление решения |
Смена распределений |
|
Обучение с подкреплением |
Ценность действия |
Последовательный выбор |
Случайный результат, неполнота |
|
Гибридные модели |
Параметры, управление |
Оптимизация в реальном времени |
Неизвестные параметры |
|
Робастные модели |
Риск, квантиль |
Риск-ориентированный выбор |
Выбросы, экстремальные события |
В совокупности обзор литературы показывает, что для задач управления экономическими системами наибольшую значимость имеют три группы моделей, а именно: регрессионные и комбинированные модели оценки состояния, классификационные модели распознавания экономических ситуаций и модели последовательного выбора действия, основанные на обучении с подкреплением и стохастической оптимизации.
В рамках стохастической оптимизации управленческих решений в экономике формализация задачи обычно строится посредством представления экономической системы как динамической структуры, состояние которой задаётся вектором переменных, отражающих текущие характеристики среды и результаты предшествующих решений. Поток данных рассматривается как последовательность наблюдений, поступающих во времени и уточняющих оценку состояния системы, при этом сами данные могут содержать задержки, пересмотры и шум, что влияет на точность текущих оценок и последующих действий [2].
Функция цели задаётся в виде агрегированного критерия, отражающего экономический результат на горизонте принятия решений, и включает в себя как текущий эффект, так и ожидаемые последствия в будущих состояниях, что, как правило, переводит задачу в класс последовательного выбора с учётом траектории развития системы [1].
Ограничения в модели фиксируют допустимые области решений, ресурсные рамки и институциональные условия функционирования системы, в то время как параметры модели трактуются как случайные величины или процессы с изменяющимися характеристиками.
Стохастическая природа параметров проявляется в неопределённости реакций системы на управленческое воздействие и в изменении распределений во времени, что требует включения процедур адаптивной оценки и обновления параметров непосредственно в структуру задачи оптимизации [7]. Как следствие, формализованная постановка объединяет в себя три ключевых взаимосвязанных элемента: поток данных, механизм обновления состояния и правило выбора решения, что позволяет описывать управление экономической системой как непрерывный процесс согласования информации, модели и целевой функции.
Алгоритм построения модели принятия решений в реальном времени формируется как последовательность шагов, связывающих поступление данных, обновление параметров и выбор управленческого воздействия:
- на первом этапе фиксируется текущее состояние системы на основе доступного потока наблюдений, после чего производится оценка неизвестных или изменяющихся параметров с использованием процедур машинного обучения, ориентированных на адаптацию к новой информации;
- на втором этапе формируется краткосрочное прогнозное представление динамики системы, позволяющее оценить последствия возможных действий, после чего осуществляется выбор решения по заданному критерию с учётом текущих ограничений;
- на завершающем этапе результат реализации управленческого решения включается в поток данных и используется для последующего уточнения параметров [7].
Ключевая особенность алгоритма состоит в объединении процедур оценки и оптимизации в единую итеративную схему, в которой параметры модели пересчитываются по мере накопления информации, что обеспечивает согласование решений с фактической динамикой системы и позволяет учитывать изменение структуры зависимостей во времени. При этом важную роль играет механизм коррекции весов наблюдений и обновления модели, позволяющий снижать влияние устаревшей информации и усиливать значимость новых данных [4]. Как следствие, формируется адаптивная модель принятия решений, в которой выбор действия определяется как текущей оценкой состояния, так и траекторией её изменения, что усиливает связь между процессом обучения и процессом управления. Теоретические свойства модели принятия решений в реальном времени целесообразно рассматривать в их внутренней взаимосвязи (табл. 2).
Таблица 2.
Свойства модели принятия управленческих решений в рамках задач машинного обучения и стохастической оптимизации
|
Свойство модели |
Содержание |
Проявление в модели |
Значение для управления |
Риск нарушения |
|
Устой-чивость |
Сохранение качества решения при колебаниях данных |
Ограниченная изменчивость параметров и решения |
Надёжность управленческих воздействий |
Дестабилизация решений при шуме |
|
Адаптив-ность |
Способность к обновлению параметров при поступлении новых данных |
Пересчёт модели, учет текущих наблюдений |
Соответствие динамике экономической системы |
Потеря накопленной информации |
|
Сходимость |
Приближение к области эффективных решений во времени |
Снижение разброса решений, стабилизация траектории |
Предсказуемость результатов управления |
Зависание в неэффективных решениях |
|
Чувстви-тельность к неопределён-ности |
Реакция на изменение параметров и структуры данных |
Изменение решения при варьировании входных условий |
Учет риска и вариативности среды |
Избыточная или недостаточная реакция |
|
Робастность |
Устойчивость к выбросам |
Сглаживание влияния аномалий |
Снижение риска ошибочных решений |
Потеря точности в нормальных условиях |
|
Опера-тивность |
Скорость обновления параметров и выбора решения |
Минимизация временного лага обработки данных |
Применимость в реальном времени |
Запаздывание реакции системы |
|
Согласованность |
Соответствие решения целевой функции и ограничениям |
Учет ресурсов и институциональных рамок |
Корректность управленческого воздействия |
Нарушение ограничений |
|
Обучаемость |
Способность модели улучшать результаты на основе опыта |
Накопление информации и уточнение параметров |
Повышение качества решений |
Переобучение или деградация модели |
Так, сходимость имеет содержательный смысл только при условии сохранения приемлемого качества решения на последовательности новых наблюдений, адаптивность ценна при отсутствии разрушения ранее накопленной информации, чувствительность к неопределённости важна постольку, поскольку она не вносит избыточную реакцию на случайные отклонения входных данных [5]. Поэтому оценка модели должна связываться с характером изменения решения на протяжённом временном интервале. В рамках умеренной вариативности параметров экономической системы приемлемая модель отражает плавное изменение траектории выбора, сохраняет согласованность целевой функции с ресурсными ограничениями и удерживает качество решения на достаточном для практики управления уровне [7]. Важно отметить, что адаптивность в задачах стохастической оптимизации не сводится к быстрому обновлению параметров — более существенное значение имеет способность модели различать кратковременный шум и признаки реального сдвига в состоянии экономической системы [4]. Сходимость в прикладном смысле также имеет более сложное толкование — суть заключается в приближении к области приемлемых решений, сохраняющей экономический смысл с учётом изменения данных и структуры риска [1]. Чувствительность к неопределённости, в свою очередь, должна иметь ограниченный характер. При чрезмерной реакции модель теряет пригодность для управления, при ослабленной реакции — запаздывает по отношению к динамике среды. В этой границе между инерцией и избыточной изменчивостью раскрывается теоретическая ценность моделей машинного обучения для задач принятия решений в экономических системах [6].
Обобщение теоретических подходов к использованию машинного обучения и стохастической оптимизации управленческих решений в экономике показывает, что развитие таких моделей связано с переходом от раздельного использования прогнозирования и выбора решения к их объединению в едином процессе, ориентированном на непрерывное обновление параметров и учет динамики среды [7]. При этом ключевым направлением является усиление способности моделей работать с изменяющейся структурой данных и учитывать неопределённость не как внешнее ограничение, а как внутреннее свойство экономической системы, влияющее на выбор действия [5]. Перспективным также выступает развитие моделей, в которых последовательное принятие решений сочетается с накоплением опыта и оценкой долгосрочных эффектов, что позволяет приближать вычислительные схемы к реальной практике управления [1]. Вместе с тем сохраняется значение задач повышения устойчивости и интерпретируемости моделей, что необходимо для их применения в условиях ограничений и рисков, характерных для экономических систем [6].
Таким образом, проведённый анализ позволяет рассматривать современные модели машинного обучения в задачах стохастической оптимизации как инструменты, меняющие сам способ принятия управленческих решений в экономике. Современные управленческие решения формируются в процессе работы с данными и уточняются по мере их поступления, что делает управление более гибким и приближённым к реальной динамике экономических процессов, в которых значения показателей и связи между ними постоянно меняются. При этом практическая ценность рассмотренных моделей связана как с точностью прогнозов, так и со способностью учитывать неопределённость, различать значимые изменения и случайные отклонения, а также поддерживать согласованность решений с ограничениями системы.
С другой стороны, использование таких моделей связано с рядом содержательных ограничений, которые нельзя игнорировать. Повышение сложности моделей не всегда приводит к улучшению качества решений, особенно в условиях нестабильных данных и структурных сдвигов. Не менее важным является соблюдение баланса между скоростью обновления параметров и сохранением накопленного опыта, а также между чувствительностью к изменениям и устойчивостью к шуму в данных. В этом контексте развитие методов машинного обучения в экономике связано и с ростом вычислительных возможностей, и с более глубоким пониманием природы экономических систем, в рамках которых любое решение должно оставаться осмысленным и применимым в реальной практике управления.
Обобщение теоретических результатов и постановка направлений развития моделей машинного обучения в задачах стохастической оптимизации сводится к тому, что дальнейшее развитие данной области знаний, по всей вероятности, будет связано с усилением интеграции процедур оценки и выбора решения, а также с расширением возможностей работы с изменяющейся структурой данных и неопределённостью как внутренним свойством экономической системы. Перспективным также представляется развитие моделей, способных учитывать долгосрочные последствия решений и накапливать опыт их применения, с учётом сохранения устойчивости и интерпретируемости, что определяет их применимость в задачах управления экономическими системами.
Список литературы:
- Jaimungal S. Reinforcement learning and stochastic optimisation // Finance and Stochastics. — 2022. — Vol. 26. — No. 1. — P. 103-129
- Richardson A., van Florenstein Mulder T., Vehbi T. Nowcasting GDP using machine-learning algorithms: A real-time assessment // International journal of forecasting. — 2021. — Vol. 37. — No. 2. — P. 941-948.
- Fornaro P., Luomaranta H. Nowcasting Finnish real economic activity: a machine learning approach // Empirical Economics. — 2020. — Vol. 58. — No. 1. — P. 55-71.
- Вьюгин В. В., Калмыков В. К., Трунов В. Г. Онлайн обучение многокомпонентных прогнозирующих систем // Информационные процессы. — 2021. — Т. 21. — № 1. — С. 50-64.
- Ermolieva T. et al. Connections between robust statistical estimation, robust decision-making with two-stage stochastic optimization, and robust machine learning problems // Cybernetics and systems analysis. — 2023. — Vol. 59. — No. 3. — P. 385-397.
- Charpentier A., Elie R., Remlinger C. Reinforcement learning in economics and finance // Computational Economics. — 2023. — Vol. 62. — No. 1. — P. 425-462.
- Chen Y., Zhou Y. Machine learning based decision making for time varying systems: Parameter estimation and performance optimization // Knowledge-Based Systems. — 2020. — Vol. 190. — P. 1-9.
- Kim T., Ha B., Hwangbo S. Online machine learning approach for system marginal price forecasting using multiple economic indicators: A novel model for real-time decision making // Machine Learning with Applications. — 2023. — Vol. 14. — P. 1-13.
- Zhang Z. et al. Real-time optimization and control of nonlinear processes using machine learning // Mathematics. — 2019. — Vol. 7. — No. 10. — P. 1-25.
- Берсенёв В. Л., Бучинская О. Н. Анализ угроз жизнестойкости российской экономики с помощью алгоритмов машинного обучения // Вестник Института экономики Российской академии наук. — 2025. — № 5. — С. 121-145.
дипломов

