Статья опубликована в рамках: Научного журнала «Студенческий» № 2(340)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7
РАЗРАБОТКА РЕГРЕССИОННОЙ МОДЕЛИ ПРОГНОЗИРОВАНИЯ ЗАРАБОТНОЙ ПЛАТЫ С ИСПОЛЬЗОВАНИЕМ МЕТОДА СЛУЧАЙНОГО ЛЕСА
DEVELOPMENT OF A REGRESSION MODEL FOR WAGE FORECASTING USING THE RANDOM FOREST METHOD
Andreev Andrey Alexandrovich
student, Faculty of Informatics and Computer Science, Chuvash State University named after I.N. Ulyanov,
Russia, Cheboksary
АННОТАЦИЯ
В статье рассматривается использование искусственного интеллекта (ИИ) для прогнозирования заработных плат в различных профессиональных сферах с помощью алгоритма машинного обучения, учитывающего такие факторы, как отрасль, должность, уровень автоматизации, уровень внедрения ИИ и географическое расположение. Разработано веб-приложение на базе Flask, позволяющее получать прогноз заработной платы с высокой точностью.
ABSTRACT
The article discusses the use of artificial intelligence (AI) to predict salaries in various professional fields using a machine learning algorithm that takes into account factors such as industry, position, level of automation, level of AI implementation, and geographical location. A Flask-based web application has been developed that allows you to get a salary forecast with high accuracy.
Ключевые слова: веб-сервис, автоматизация, искусственный интеллект, прогнозирование, машинное обучение, разработка.
Keywords: web service, automation, artificial intelligence, forecasting, machine learning, development.
Современный рынок труда претерпевает значительные изменения под влиянием автоматизации и искусственного интеллекта (ИИ). Эти технологии по-разному влияют на различные виды трудовой деятельности.
Некоторые задачи, в первую очередь рутинные и предсказуемые, подвержены автоматизации. Например, в бухгалтерии значительная часть операций автоматизирована специальными программами и системами электронного документооборота. Еще один яркий пример – производство. Здесь роботизированные линии выполняют большую часть работ, минимизируя потребность в большом количестве работников физического труда. Такие процессы ведут к снижению заработной платы и сокращению числа рабочих мест, поскольку работодатели экономят ресурсы благодаря технологическим инновациям.
В других случаях искусственный интеллект усиливает возможности специалистов, позволяя им быстрее и эффективнее решать сложные задачи, требующие креативности, эмоционального интеллекта и стратегического мышления. Здесь можно выделить область экономики, где специалисты используют аналитические системы для принятия стратегических решений на основе больших данных, а также область медицины, где врачи применяют продвинутые алгоритмы диагностики, методы машинного обучения для анализа медицинских изображений и планирования лечения пациентов. Эти сферы требуют высокообразованных профессионалов, способных эффективно взаимодействовать с технологиями, и спрос на таких сотрудников растет вместе с зарплатами.
Прогнозирование заработной платы может оказаться необходимой и востребованной во многих ситуациях. Например, для соискателей вакансий при выборе направления. Или же для работодателей при планировании бюджета или оценке производительности. Также для государственных органов и аналитиков при анализе социально-экономических процессов и прогнозировании налоговых поступлений.
Для прогнозирования заработной платы существуют различные методы. Классические подходы, такие как регрессионный анализ, который учитывает макроэкономические и отраслевые факторы, но плохо адаптируется к нелинейным зависимостям [1], и ARIMA, подходящий для временных рядов, но не учитывающий технологические сдвиги, показывают ограниченную эффективность. Поэтому для построения прогнозной модели был выбран алгоритм Random Forest, который демонстрирует высокую точность, устойчивость к переобучению и возможность работы с категориальными данными, а также представляет собой оптимальный баланс между точностью и практичностью использования по сравнению с другими алгоритмами [2]. Модель основана на ансамбле деревьев решений, каждый из которых строится на случайной выборке объектов и признаков исходного набора данных.
Приложение реализовано с использованием современного технологического стека: фреймворк Flask для бэкенд-логики (обработка данных, работа с моделью), CSS-фреймворк bootstrap для адаптивного фронтенда, sklearn для использования модели Random Forest и pandas для предобработки введенных пользователем данных. Данный технологический стек обладает большим преимуществом в виде простоты использования, гибкости, легкой масштабируемости, адаптивности ко многим платформам, производительности и эффективности.
Веб-сервис обладает интуитивно понятным интерфейсом, состоящим из двух страниц: главной страницы и страницы результатов прогнозирования. Функционал приложения, позволяет пользователям вводить исходные параметры для прогнозирования (рис. 1), получать прогноз заработной платы с оценкой точности и сохранять историю запросов для сравнения результатов (рис. 2).

Рисунок 1. Страница ввода данных

Рисунок 2. Страница с прогнозируемой зарплатой
Тестирование модели проводилось на реальных данных с использованием датасета «AI Powered Job Market Insights» [3], который содержит информацию о вакансиях в сфере ИИ, включая должности, компании, локации, требуемые навыки и годовую зарплату (в долларах), собранные с платформ вроде LinkedIn и Indeed. Обучение модели и проведение тестирования для выявления точности происходит при запуске приложения.
Для вычисления точности модели использованы два метода: вычисление коэффициента детерминации R2, который показывает долю вариации зависимой переменной, объясняемую независимой переменной или набором независимых переменных и вычисление средней абсолютной ошибки MAE, которая показывает среднюю величину отклонения прогнозируемых значений от реальных. После обучения модели и вычисления точности выяснилось следующее: коэффициент детерминации R2 оказался равным 0.839. Это означает, что модель объясняет 83.9% дисперсии данных. А средняя абсолютная ошибка MAE, равная 6162$, демонстрирует достаточно хорошую точность прогнозов.
Например, для должности специалиста по данным в IT-отрасли с высоким уровнем внедрения ИИ в компанию модель прогнозирует годовую заработную плату в размере 196.400$ с возможным отклонением в размере 6162$. В то время как для той же профессии, но с низким уровнем внедрения ИИ в компанию модель прогнозирует заработную плату в размере 96.300$. Исходя из результатов прогнозов, утверждение о том, что в сферах, где ИИ дополняет человеческий труд, зарплаты растут из-за повышения спроса на высококвалифицированных специалистов, полностью подтверждается.
Таким образом, применение технологий машинного обучения для прогнозирования заработной платы с учетом уровня автоматизации и внедрения ИИ представляет собой эффективный инструмент адаптации к цифровой трансформации экономики.
Список литературы:
- Методы прогнозирования. Регрессионный анализ [Электронный ресурс]. – Режим доступа: https://practicum.yandex.ru/blog/chto-takoe-regressionnyj-analiz/ (дата обращения: 25.12.2025)
- Алгоритм случайного леса [Электронный ресурс]. – Режим доступа: https://ru.statisticseasily.com/%D1%81%D0%BB%D1%83%D1%87%D0%B0%D0%B9%D0%BD%D1%8B%D0%B9-%D0%BB%D0%B5%D1%81/ (дата обращения: 25.12.2025)
- Датасет AI Powered Job Market Insights [Электронный ресурс]. – Режим доступа: https://www.kaggle.com/datasets/uom190346a/ai-powered-job-market-insights (дата обращения: 25.12.2025)


Оставить комментарий