Статья опубликована в рамках: CV Международной научно-практической конференции «Актуальные вопросы экономических наук и современного менеджмента» (Россия, г. Новосибирск, 06 апреля 2026 г.)

Наука: Экономика

Секция: Теория управления экономическими системами

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Лубин Н.К. МАШИННОЕ ОБУЧЕНИЕ И СТОХАСТИЧЕСКАЯ ОПТИМИЗАЦИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В ЭКОНОМИКЕ // Актуальные вопросы экономических наук и современного менеджмента: сб. ст. по матер. CV междунар. науч.-практ. конф. № 4(88). – Новосибирск: СибАК, 2026. – С. 103-114.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

МАШИННОЕ ОБУЧЕНИЕ И СТОХАСТИЧЕСКАЯ ОПТИМИЗАЦИЯ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ В ЭКОНОМИКЕ

Лубин Николай Константинович

аспирант, Московский университет „Синергия“,

РФ, г. Москва

MACHINE LEARNING AND STOCHASTIC OPTIMIZATION OF MANAGEMENT DECISIONS IN ECONOMICS

Lubin Nikolai Konstantinovich

Postgraduate student, Moscow University "Synergy",

Russia, Moscow

АННОТАЦИЯ

Цель — теоретическое обоснование подхода к принятию управленческих решений в экономических системах на основе интеграции методов машинного обучения и стохастической оптимизации. Методы: теоретический анализ, сравнительный анализ, обобщение научных подходов, систематизация моделей. Результат: сформировано представление о принятии управленческих решений, основанном на непрерывном обновлении параметров и учёте изменчивости экономической среды. Выводы: а) интеграция оценки параметров и выбора решения обеспечивает более точное согласование управленческих действий с текущим состоянием экономической системы; б) применимость модели для практики управления определяют свойства устойчивости, адаптивности, сходимости и чувствительности; в) развитие моделей связано с усилением их способности учитывать неопределённость и динамику данных в процессе принятия управленческих решений.

ABSTRACT

Background — theoretical substantiation of an approach to managerial decision-making in economic systems based on integration of machine learning methods and stochastic optimization. Methods: theoretical analysis, comparative analysis, synthesis of scientific approaches, systematization of models. Result: conceptualization of managerial decision-making based on continuous parameter updating and consideration of variability of economic environment. Conclusions: a) integration of parameter estimation and decision selection ensures more accurate alignment of managerial actions with current state of economic system; b) applicability of the model in practice is determined by properties of stability, adaptability, convergence, and sensitivity; c) further development of models is associated with enhanced ability to account for uncertainty and data dynamics in decision-making processes.

Ключевые слова: машинное обучение; стохастическая оптимизация; управленческие решения; экономические системы; принятие решений в реальном времени.

Keywords: machine learning; stochastic optimization; managerial decision-making; economic systems; real-time decision-making.

Управленческие решения в экономике формируются в среде, для которой характерны неполнота информации, изменчивость параметров и разрывы во временных рядах наблюдений, что актуализирует релевантность задачи стохастической оптимизации, ориентированной на работу с вероятностными оценками состояний системы [1]. Потоки данных в экономических системах поступают неравномерно, пересматриваются и дополняются, в связи с чем статические модели утрачивают возможности объяснения экономических процессов уже на этапе текущей оценки экономической динамики [2]. Вместе с тем расширение массивов наблюдений и появление высокочастотных индикаторов формируют возможность более точного восстановления текущего состояния экономики в реальном времени, однако сама процедура оценки имеет характер непрерывного обновления параметров и пересчёта прогнозов [3]. В этих условиях управленческое решение рассматривается как последовательность взаимосвязанных действий, зависящих от эволюции информации и структуры неопределённости, что усиливает роль методов, способных учитывать вероятностные сценарии и корректировать траекторию управления экономической системой по мере поступления новых данных [4].

Развитие методов машинного обучения усиливает аналитический потенциал стохастической оптимизации за счет расширения возможности работы с высокоразмерными пространствами признаков, нелинейными зависимостями и изменяющимися параметрами экономических систем [5]. В задачах динамического выбора большое значение имеют подходы, основанные на последовательном обучении и учёте накопленного опыта, в рамках которых управленческое решение определяется как функция состояния системы и ожидаемого выигрыша на горизонте будущих периодов [6]. При этом практическая значимость таких методов проявляется в способности объединять оценку параметров и выбор действия в единой процедуре, ориентированной на достижение целевых показателей функционирования системы [7]. Введение адаптивных алгоритмов, способных обновлять модели в процессе эксплуатации, позволяет повысить согласованность решений с фактической динамикой экономической среды и снизить влияние ошибочных предпосылок, неизбежных в условиях неопределённости и структурных сдвигов [8]. В связи с чем актуальность исследования определяется необходимостью развития математических и компьютерных средств анализа и оптимизации управленческих решений в экономических системах, функционирующих в условиях неопределённости и непрерывного обновления данных.

Стохастическая оптимизация управленческих решений формируется как развитие классических задач оптимального управления в условиях неопределённости, в которых состояние системы и параметры среды заданы распределением вероятностей и сценарии их изменения во времени [9]. В рамках экономических систем это выражается в необходимости учитывать воздействие шоков, разрывов динамики и смены траекторий развития [10]. Теоретическая база стохастической оптимизации опирается на постановки задач с последовательным принятием решений, в которых выбор определяется текущим состоянием системы, доступной информацией и ожиданием будущих эффектов, что сближает экономические задачи с классом марковских процессов принятия решений и динамического программирования [6]. В этой логике управленческое решение рассматривается как функция развития системы, тогда как критерий оптимальности имеет форму максимизации совокупного результата на горизонте будущих состояний [1]. Кроме того, важен учет неопределённости параметров, включая их изменчивость во времени [7].

Роль машинного обучения в данной теоретической области связана с возможностью перехода от заданных параметров к их оценке на основе данных, что расширяет область применимости стохастической оптимизации в условиях сложных и слабо формализуемых экономических процессов [5]. Машинное обучение вводит в модель механизм непрерывного обновления знаний о системе, что позволяет учитывать новые наблюдения, выявлять скрытые зависимости и уточнять структуру функции решения без необходимости жёсткой предварительной спецификации [4]. В задачах реального времени это проявляется в совмещении процедур оценки состояния и выбора действия, что обеспечивает согласование решений с текущей динамикой данных и снижает зависимость от априорных допущений [8]. В частности, при работе с высокоразмерными наборами признаков и потоками информации машинное обучение позволяет строить комбинированные модели, объединяющие статистические и вычислительные методы, что усиливает точность оценки и устойчивость решения к пересмотру входных данных [2]. В совокупности это формирует теоретическую основу интеграции стохастической оптимизации и методов машинного обучения в задачах управления экономическими системами, в рамках которой выбор решения определяется как результат непрерывного взаимодействия модели, данных и критериев эффективности [3].

Среди моделей машинного обучения, применяемых в задачах оптимизации в области управления экономическими системами, заметное место занимают регрессионные и комбинированные модели, ориентированные на оценку текущего состояния системы и на последующий выбор действия. Так, у Т. Кима и коллег сопоставлены опорная векторная регрессия, простая глубокая нейронная сеть и глубокая нейронная сеть, после чего лучшая модель переводится в формат последовательного обновления параметров [8]. В работе П. Форнаро и Х. Луомаранта используются комбинации статистических моделей и методов машинного обучения для оперативной оценки месячной и квартальной экономической активности, вследствие чего модельный блок служит информационной базой для последующего выбора управленческого решения [3]. У А. Ричардсона и коллег сопоставляются усиленные деревья (boosted trees), регрессию с использованием метода опорных векторов (support vector machine regression), нейронные сети и факторная модель в задаче оперативной оценки валового продукта, при этом машинное обучение отражает преимущество над традиционными бенчмарками в режиме реального времени [2]. В статье В. В. Вьюгина, В. К. Калмыкова и В. Г. Трунова представлены агрегирующие алгоритмы экспертных прогнозов и нейросетевые модели непрерывного обучения, применимые для потока данных с изменяющейся природой источника [4]. У В. Л. Берсенёва и О. Н. Бучинской в задаче диагностики шокового состояния экономики используются дерево решений и модель AdaBoost, что показывает значимость классификационных моделей для распознавания состояний экономической системы перед выбором управленческого воздействия [10].

Для собственно оптимизационных задач наибольший интерес представляют модели, в которых машинное обучение включается в процедуру выбора управленческого решения. В частности, у И. Чэня и И. Чжоу предложена схема, объединяющая оценку неизвестных переменных параметров на основе данных и модельно-предиктивное управление, вследствие чего управленческое решение связывается с текущим состоянием системы и целевыми показателями её функционирования [7]. У З. Чжана и коллег нейронная сеть сочетается с моделью первого принципа в задачах оптимизации в реальном времени и модель прогнозирующего управления, что особенно важно для теории управления экономическими системами, когда одна часть зависимостей известна заранее, другая — подлежит оценке по данным [9]. У С. Джаймунгала и коллег центральное место занимают модели обучения с подкреплением, многорукие бандиты (англ. multi-armed bandit), функции ценности и марковские процессы принятия решений, т.е. вычислительные конструкции, переводящие машинное обучение в область последовательного выбора действия при случайной динамике среды [1]. В работе Т. Ермолиевой и коллег машинное обучение связывается с двухэтапной стохастической оптимизацией, квантильной регрессией и стохастическими квазиградиентными алгоритмами, что расширяет круг моделей за пределы классических нейросетевых и регрессионных схем и актуализирует риск-ориентированный выбор управленческого решения [5].

В целом, можно обобщить рассмотренные модели машинного обучения в задачах стохастической оптимизации (табл. 1).

Таблица 1.

Сравнительная характеристика моделей машинного обучения в задачах стохастической оптимизации

Модель МО	Объект оценки	Тип задачи	Учет неопределённости
Регрессионные модели	Показатель, параметр	Прогноз, оценка состояния	Ошибка прогноза, изменчивость данных
Деревья решений, ансамбли	Класс состояния, фактор	Диагностика, выбор альтернативы	Пороговые переходы, сдвиги
Нейронные сети	Нелинейная зависимость	Прогноз, выявление структуры	Высокая размерность, динамика
Непрерывное обучение	Параметры, поток данных	Адаптация, обновление решения	Смена распределений
Обучение с подкреплением	Ценность действия	Последовательный выбор	Случайный результат, неполнота
Гибридные модели	Параметры, управление	Оптимизация в реальном времени	Неизвестные параметры
Робастные модели	Риск, квантиль	Риск-ориентированный выбор	Выбросы, экстремальные события

В совокупности обзор литературы показывает, что для задач управления экономическими системами наибольшую значимость имеют три группы моделей, а именно: регрессионные и комбинированные модели оценки состояния, классификационные модели распознавания экономических ситуаций и модели последовательного выбора действия, основанные на обучении с подкреплением и стохастической оптимизации.

В рамках стохастической оптимизации управленческих решений в экономике формализация задачи обычно строится посредством представления экономической системы как динамической структуры, состояние которой задаётся вектором переменных, отражающих текущие характеристики среды и результаты предшествующих решений. Поток данных рассматривается как последовательность наблюдений, поступающих во времени и уточняющих оценку состояния системы, при этом сами данные могут содержать задержки, пересмотры и шум, что влияет на точность текущих оценок и последующих действий [2].

Функция цели задаётся в виде агрегированного критерия, отражающего экономический результат на горизонте принятия решений, и включает в себя как текущий эффект, так и ожидаемые последствия в будущих состояниях, что, как правило, переводит задачу в класс последовательного выбора с учётом траектории развития системы [1].

Ограничения в модели фиксируют допустимые области решений, ресурсные рамки и институциональные условия функционирования системы, в то время как параметры модели трактуются как случайные величины или процессы с изменяющимися характеристиками.

Стохастическая природа параметров проявляется в неопределённости реакций системы на управленческое воздействие и в изменении распределений во времени, что требует включения процедур адаптивной оценки и обновления параметров непосредственно в структуру задачи оптимизации [7]. Как следствие, формализованная постановка объединяет в себя три ключевых взаимосвязанных элемента: поток данных, механизм обновления состояния и правило выбора решения, что позволяет описывать управление экономической системой как непрерывный процесс согласования информации, модели и целевой функции.

Алгоритм построения модели принятия решений в реальном времени формируется как последовательность шагов, связывающих поступление данных, обновление параметров и выбор управленческого воздействия:

на первом этапе фиксируется текущее состояние системы на основе доступного потока наблюдений, после чего производится оценка неизвестных или изменяющихся параметров с использованием процедур машинного обучения, ориентированных на адаптацию к новой информации;
на втором этапе формируется краткосрочное прогнозное представление динамики системы, позволяющее оценить последствия возможных действий, после чего осуществляется выбор решения по заданному критерию с учётом текущих ограничений;
на завершающем этапе результат реализации управленческого решения включается в поток данных и используется для последующего уточнения параметров [7].

Ключевая особенность алгоритма состоит в объединении процедур оценки и оптимизации в единую итеративную схему, в которой параметры модели пересчитываются по мере накопления информации, что обеспечивает согласование решений с фактической динамикой системы и позволяет учитывать изменение структуры зависимостей во времени. При этом важную роль играет механизм коррекции весов наблюдений и обновления модели, позволяющий снижать влияние устаревшей информации и усиливать значимость новых данных [4]. Как следствие, формируется адаптивная модель принятия решений, в которой выбор действия определяется как текущей оценкой состояния, так и траекторией её изменения, что усиливает связь между процессом обучения и процессом управления. Теоретические свойства модели принятия решений в реальном времени целесообразно рассматривать в их внутренней взаимосвязи (табл. 2).

Таблица 2.

Свойства модели принятия управленческих решений в рамках задач машинного обучения и стохастической оптимизации

Свойство модели	Содержание	Проявление в модели	Значение для управления	Риск нарушения
Устой-чивость	Сохранение качества решения при колебаниях данных	Ограниченная изменчивость параметров и решения	Надёжность управленческих воздействий	Дестабилизация решений при шуме
Адаптив-ность	Способность к обновлению параметров при поступлении новых данных	Пересчёт модели, учет текущих наблюдений	Соответствие динамике экономической системы	Потеря накопленной информации
Сходимость	Приближение к области эффективных решений во времени	Снижение разброса решений, стабилизация траектории	Предсказуемость результатов управления	Зависание в неэффективных решениях
Чувстви-тельность к неопределён-ности	Реакция на изменение параметров и структуры данных	Изменение решения при варьировании входных условий	Учет риска и вариативности среды	Избыточная или недостаточная реакция
Робастность	Устойчивость к выбросам	Сглаживание влияния аномалий	Снижение риска ошибочных решений	Потеря точности в нормальных условиях
Опера-тивность	Скорость обновления параметров и выбора решения	Минимизация временного лага обработки данных	Применимость в реальном времени	Запаздывание реакции системы
Согласованность	Соответствие решения целевой функции и ограничениям	Учет ресурсов и институциональных рамок	Корректность управленческого воздействия	Нарушение ограничений
Обучаемость	Способность модели улучшать результаты на основе опыта	Накопление информации и уточнение параметров	Повышение качества решений	Переобучение или деградация модели

Так, сходимость имеет содержательный смысл только при условии сохранения приемлемого качества решения на последовательности новых наблюдений, адаптивность ценна при отсутствии разрушения ранее накопленной информации, чувствительность к неопределённости важна постольку, поскольку она не вносит избыточную реакцию на случайные отклонения входных данных [5]. Поэтому оценка модели должна связываться с характером изменения решения на протяжённом временном интервале. В рамках умеренной вариативности параметров экономической системы приемлемая модель отражает плавное изменение траектории выбора, сохраняет согласованность целевой функции с ресурсными ограничениями и удерживает качество решения на достаточном для практики управления уровне [7]. Важно отметить, что адаптивность в задачах стохастической оптимизации не сводится к быстрому обновлению параметров — более существенное значение имеет способность модели различать кратковременный шум и признаки реального сдвига в состоянии экономической системы [4]. Сходимость в прикладном смысле также имеет более сложное толкование — суть заключается в приближении к области приемлемых решений, сохраняющей экономический смысл с учётом изменения данных и структуры риска [1]. Чувствительность к неопределённости, в свою очередь, должна иметь ограниченный характер. При чрезмерной реакции модель теряет пригодность для управления, при ослабленной реакции — запаздывает по отношению к динамике среды. В этой границе между инерцией и избыточной изменчивостью раскрывается теоретическая ценность моделей машинного обучения для задач принятия решений в экономических системах [6].

Обобщение теоретических подходов к использованию машинного обучения и стохастической оптимизации управленческих решений в экономике показывает, что развитие таких моделей связано с переходом от раздельного использования прогнозирования и выбора решения к их объединению в едином процессе, ориентированном на непрерывное обновление параметров и учет динамики среды [7]. При этом ключевым направлением является усиление способности моделей работать с изменяющейся структурой данных и учитывать неопределённость не как внешнее ограничение, а как внутреннее свойство экономической системы, влияющее на выбор действия [5]. Перспективным также выступает развитие моделей, в которых последовательное принятие решений сочетается с накоплением опыта и оценкой долгосрочных эффектов, что позволяет приближать вычислительные схемы к реальной практике управления [1]. Вместе с тем сохраняется значение задач повышения устойчивости и интерпретируемости моделей, что необходимо для их применения в условиях ограничений и рисков, характерных для экономических систем [6].

Таким образом, проведённый анализ позволяет рассматривать современные модели машинного обучения в задачах стохастической оптимизации как инструменты, меняющие сам способ принятия управленческих решений в экономике. Современные управленческие решения формируются в процессе работы с данными и уточняются по мере их поступления, что делает управление более гибким и приближённым к реальной динамике экономических процессов, в которых значения показателей и связи между ними постоянно меняются. При этом практическая ценность рассмотренных моделей связана как с точностью прогнозов, так и со способностью учитывать неопределённость, различать значимые изменения и случайные отклонения, а также поддерживать согласованность решений с ограничениями системы.

С другой стороны, использование таких моделей связано с рядом содержательных ограничений, которые нельзя игнорировать. Повышение сложности моделей не всегда приводит к улучшению качества решений, особенно в условиях нестабильных данных и структурных сдвигов. Не менее важным является соблюдение баланса между скоростью обновления параметров и сохранением накопленного опыта, а также между чувствительностью к изменениям и устойчивостью к шуму в данных. В этом контексте развитие методов машинного обучения в экономике связано и с ростом вычислительных возможностей, и с более глубоким пониманием природы экономических систем, в рамках которых любое решение должно оставаться осмысленным и применимым в реальной практике управления.

Обобщение теоретических результатов и постановка направлений развития моделей машинного обучения в задачах стохастической оптимизации сводится к тому, что дальнейшее развитие данной области знаний, по всей вероятности, будет связано с усилением интеграции процедур оценки и выбора решения, а также с расширением возможностей работы с изменяющейся структурой данных и неопределённостью как внутренним свойством экономической системы. Перспективным также представляется развитие моделей, способных учитывать долгосрочные последствия решений и накапливать опыт их применения, с учётом сохранения устойчивости и интерпретируемости, что определяет их применимость в задачах управления экономическими системами.

Список литературы:

Jaimungal S. Reinforcement learning and stochastic optimisation // Finance and Stochastics. — 2022. — Vol. 26. — No. 1. — P. 103-129
Richardson A., van Florenstein Mulder T., Vehbi T. Nowcasting GDP using machine-learning algorithms: A real-time assessment // International journal of forecasting. — 2021. — Vol. 37. — No. 2. — P. 941-948.
Fornaro P., Luomaranta H. Nowcasting Finnish real economic activity: a machine learning approach // Empirical Economics. — 2020. — Vol. 58. — No. 1. — P. 55-71.
Вьюгин В. В., Калмыков В. К., Трунов В. Г. Онлайн обучение многокомпонентных прогнозирующих систем // Информационные процессы. — 2021. — Т. 21. — № 1. — С. 50-64.
Ermolieva T. et al. Connections between robust statistical estimation, robust decision-making with two-stage stochastic optimization, and robust machine learning problems // Cybernetics and systems analysis. — 2023. — Vol. 59. — No. 3. — P. 385-397.
Charpentier A., Elie R., Remlinger C. Reinforcement learning in economics and finance // Computational Economics. — 2023. — Vol. 62. — No. 1. — P. 425-462.
Chen Y., Zhou Y. Machine learning based decision making for time varying systems: Parameter estimation and performance optimization // Knowledge-Based Systems. — 2020. — Vol. 190. — P. 1-9.
Kim T., Ha B., Hwangbo S. Online machine learning approach for system marginal price forecasting using multiple economic indicators: A novel model for real-time decision making // Machine Learning with Applications. — 2023. — Vol. 14. — P. 1-13.
Zhang Z. et al. Real-time optimization and control of nonlinear processes using machine learning // Mathematics. — 2019. — Vol. 7. — No. 10. — P. 1-25.
Берсенёв В. Л., Бучинская О. Н. Анализ угроз жизнестойкости российской экономики с помощью алгоритмов машинного обучения // Вестник Института экономики Российской академии наук. — 2025. — № 5. — С. 121-145.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов