Статья опубликована в рамках: Научного журнала «Студенческий» № 19(357)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал
ПРИМЕНЕНИЕ ГРАДИЕНТНОГО БУСТИНГА ДЛЯ ПРОГНОЗИРОВАНИЯ ИНВЕСТИЦИЙ В ОСНОВНОЙ КАПИТАЛ НА ОСНОВЕ МАРКОЭКОНОМИЧЕСКИХ ФАКТОРОВ
GRADIENT BOOSTING APPLICATION FOR FIXED CAPITAL INVESTMENT FORECASTING BASED ON MACROECONOMIC FACTORS
Marchenko Daria Vladimirovna
Student, Department of Economic Informatics, Belarusian State University of Informatics and Radioelectronics,
Republic of Belarus, Minsk
Selivokho Stanislav Olegovich
Student, Department of Economic Informatics, Belarusian State University of Informatics and Radioelectronics,
Republic of Belarus, Minsk
Sokolovich Maxim Gennadievich
Scientific supervisor, Assistant Professor, Department of Intelligent Information Technologies, Belarusian State University of Informatics and Radioelectronics,
Republic of Belarus, Minsk
АННОТАЦИЯ
В статье рассматривается применение алгоритма градиентного бустинга для прогнозирования ежемесячного объёма инвестиций в основной капитал на горизонте 12 месяцев. Описаны процедуры формирования признакового пространства из лаговых и макроэкономических переменных, подбора гиперпараметров методом поиска по сетке и оценки качества прогнозов методом скользящей кросс-валидации. Исследование выполнено на ежемесячных данных за 2016–2024 годы. Полученная модель обеспечивает среднюю абсолютную процентную ошибку на уровне 11,11%, что свидетельствует о высокой точности прогноза на среднесрочном горизонте.
ABSTRACT
The article examines the application of gradient boosting for forecasting monthly fixed capital investment at a 12-month horizon. The procedures for feature space construction using lagged and macroeconomic variables, hyperparameter tuning via grid search, and forecast quality assessment using rolling cross-validation are described. The study is based on monthly data for 2016–2024. The resulting model achieves a mean absolute percentage error of 11.11%, indicating high forecasting accuracy at the medium-term horizon.
Ключевые слова: градиентный бустинг; прогнозирование временных рядов; инвестиции в основной капитал; машинное обучение; скользящая кросс-валидация.
Keywords: gradient boosting; time series forecasting; fixed capital investment; machine learning; rolling cross-validation.
Инвестиции в основной капитал представляют собой один из ключевых макроэкономических показателей, определяющих темпы экономического роста и уровень технологического обновления производственного потенциала. Рост валового внутреннего продукта расширяет ресурсную базу и формирует благоприятные инвестиционные ожидания [1, с. 650]. Повышение ставки рефинансирования удорожает привлечённый капитал и сдерживает капиталовложения [2, с. 460]. Ускорение инфляции усиливает макроэкономическую неопределённость и снижает реальную доходность долгосрочных вложений [3, с. 403]. Перечисленные зависимости носят нелинейный характер и сложно описываются классическими линейными моделями, что обусловливает интерес к ансамблевым алгоритмам машинного обучения [4, с. 268]. Цель настоящей работы – построение и верификация модели прогнозирования ежемесячного объёма инвестиций на горизонте 12 месяцев на основе алгоритма градиентного бустинга. Исследование выполнено на ежемесячных данных за январь 2016 – декабрь 2024 года.
Целевой переменной выступает ежемесячный объём инвестиций в основной капитал. Факторными признаками служат три макроэкономических показателя: валовой внутренний продукт, ставка рефинансирования и индекс потребительских цен. На основе исходных временных рядов сформировано признаковое пространство из 10 переменных, представленных в таблице 1. Включены авторегрессионные лаги целевой переменной с отставанием 1, 2 и 3 месяца, её скользящие средние с окнами 3 и 12 месяцев, лаговые значения макроэкономических показателей с отставанием 1 месяц и номер месяца как кодировка сезонности. Особую роль играет лаг целевой переменной с отставанием 12 месяцев: декомпозиция ряда показала, что сезонная компонента объясняет 40,3% его дисперсии, что обусловливает высокую информативность именно этого признака.
Таблица 1.
Признаковое пространство модели
|
Признак |
Описание |
Тип |
|---|---|---|
|
invest_lag1, 2, 3 |
Лаги инвестиций 1, 2, 3 мес. |
Авторегрессионный |
|
invest_lag12 |
Лаг инвестиций 12 мес. – годовая сезонность |
Сезонный |
|
invest_rolling_mean_3 |
Скользящее среднее инвестиций, окно 3 мес. |
Авторегрессионный |
|
invest_rolling_mean_12 |
Скользящее среднее инвестиций, окно 12 мес. |
Авторегрессионный |
|
gdp_lag1 |
ВВП со сдвигом 1 мес. |
Макроэкономический |
|
refin_rate_lag1 |
Ставка рефинансирования со сдвигом 1 мес. |
Макроэкономический |
|
cpi_lag1 |
Индекс потребительских цен со сдвигом 1 мес. |
Макроэкономический |
|
month |
Номер месяца от 1 до 12, кодировка сезонности |
Календарный |
Алгоритм градиентного бустинга является последовательным ансамблевым методом: каждое очередное дерево решений строится на остатках предыдущего, что обеспечивает поэтапное снижение ошибки. В работе использована реализация HistGradientBoostingRegressor библиотеки scikit-learn, основанная на гистограммном разбиении признаков. Подбор гиперпараметров выполнялся поиском по сетке на начальном обучающем окне из 60 наблюдений с валидацией на следующих 12 месяцах, критерием оптимальности же служила средняя абсолютная процентная ошибка. Перебирались количество итераций бустинга, скорость обучения, максимальная глубина дерева и коэффициент L2-регуляризации. Оптимальная конфигурация: 200 итераций, скорость обучения 0,1, глубина дерева 3, коэффициент регуляризации 0,1.
Оценка модели проводилась методом скользящей кросс-валидации, имитирующей реальный процесс прогнозирования. На каждом шаге модель обучалась на всей доступной истории начиная с 60 наблюдений, формировала прогноз на 12 месяцев вперёд, после чего обучающее окно сдвигалось и расширялось на один месяц. Тестовый период охватил 48 наблюдений – с января 2021 по декабрь 2024 года. Значение средней абсолютной процентной ошибки составило 11,11%, что соответствует высокой точности прогнозирования для макроэкономических временных рядов. Устойчивость точности на горизонте 12 месяцев обеспечивается выраженной годовой сезонностью ряда: как показала декомпозиция, сезонная компонента объясняет более 40% его дисперсии, и именно этот паттерн наиболее стабильно воспроизводится моделью.
Алгоритм градиентного бустинга обеспечивает точное и устойчивое прогнозирование инвестиций в основной капитал на горизонте 12 месяцев. Формирование признакового пространства из лаговых значений, скользящих средних и макроэкономических показателей позволяет модели одновременно учитывать инерционность инвестиционного процесса и его чувствительность к монетарной среде. Применение поиска по сетке и скользящей кросс-валидации при подборе гиперпараметров обеспечивает корректность оценки и предотвращает переобучение. Предложенная методология может быть адаптирована для прогнозирования иных макроэкономических показателей с выраженной сезонностью и зависимостью от денежно-кредитных инструментов регулирования.
Список литературы:
- Blanchard O., Fischer S. Lectures on Macroeconomics. – Cambridge: MIT Press, 1989. – 650 p.
- Dornbusch R., Fischer S. The open economy: implications for monetary and fiscal policy // The American Business Cycle: Continuity and Change. – Chicago: University of Chicago Press, 1986. – P. 459–516.
- Keynes J. M. The General Theory of Employment, Interest and Money. – London: Macmillan, 1936. – 403 p.
- Ионова Т. А. Сравнительный анализ методов прогнозирования временных рядов // Прикладная математика и информатика: современные исследования в области естественных и технических наук. – 2020. – С. 266–271.

