Статья опубликована в рамках: Научного журнала «Студенческий» № 17(355)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
ИСПОЛЬЗОВАНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ
USING MACHINE LEARNING FOR FORECASTING
Elsner Igor Vladimirovich
Student, Ural State University of Economics,
Russia, Ekaterinburg
Varaxin Konstantin Dmitrievich
Student, Ural State University of Economics,
Russia, Ekaterinburg
АННОТАЦИЯ
Введение. Данная статья рассматривает применение машинного обучения для прогнозирования различных процессов и явлений. Цель исследования — проанализировать существующие подходы к использованию алгоритмов машинного обучения для прогнозирования и оценить их эффективность. Материал и методы. Был проведен обзор научной литературы, а также проанализированы популярные алгоритмы машинного обучения для задач прогнозирования. Результаты и выводы. Исследование показало, что различные методы машинного обучения, такие как регрессионные модели, деревья решений и нейронные сети, могут успешно применяться для прогнозирования. Однако каждый метод имеет свои преимущества и ограничения.
ABSTRACT
Introduction. This article explores the application of machine learning for forecasting various processes and phenomena. The aim of the study is to analyze existing approaches to using machine learning algorithms for forecasting and assess their effectiveness. Materials and methods. A review of scientific literature was conducted, as well as an analysis of popular machine learning algorithms for forecasting tasks. Results and conclusions. The study showed that various machine learning methods, such as regression models, decision trees, and neural networks, can be successfully applied for forecasting. However, each method has its own advantages and limitations.
Ключевые слова: машинное обучение, прогнозирование, алгоритмы, данные, эффективность.
Keywords: machine learning, forecasting, algorithms, data, efficiency.
Введение
В современном мире прогнозирование одна из ключевых задач во многих областях науки и практики. Традиционные методы прогнозирования часто сталкиваются с ограничениями, такими как сложность данных, нелинейность процессов и высокая размерность задач. Развитие технологий искусственного интеллекта, в частности машинного обучения, предоставило новые возможности для повышения точности прогнозов.
Машинное обучение представляет собой подраздел искусственного интеллекта, фокусирующийся на создании алгоритмов, способных автоматически выявлять закономерности в данных и использовать их для прогнозирования будущих событий. В данной статье мы рассмотрим основные подходы к использованию машинного обучения для прогнозирования, их преимущества и ограничения, а также практические примеры применения.
Гипотеза
Методы машинного обучения могут значительно повысить точность прогнозирования процессов и явлений в сравнении с традиционными методами анализа данных. Это особенно актуально для задач, связанных с анализом больших объемов данных, таких как временные ряды, медицинские показатели или финансовые индикаторы.
Цель исследования
Оценить эффективность различных методов машинного обучения для задач прогнозирования и проанализировать их применимость в разных областях.
Материалы и методы
Для подтверждения или опровержения гипотезы был проведен анализ эффективности различных алгоритмов машинного обучения. Была взятa выборка из разных направлений: экономика, медицина и энергетика. В исследование были выбраны 30 наборов данных (15 для обучения моделей и 15 для тестирования). Алгоритмы оценивались по следующим показателям: среднеквaдратическая ошибка (MSE), коэффициент детерминации (R²) и время обучения модели [1].
Между собой сравнивались три основные группы методов:
- Регрессионные модели – линейная регрессия, полиномиaльная регрессия;
- Деревья решений и ансамбли – случaйный лес (Random Forest), грaдиентный бустинг (Gradient Boosting);
- Нейронные сети – рекуррентные нейронные сети (RNN) и сети с долгой краткосрочной памятью (LSTM).
Стaтистический анализ результатов был выполнен с использованием программного обеспечения Python и библиотеки Scikit-learn. Покaзaтелями эффективности служили метрики, такие как MSE, R² и точность прогноза [2].
Результаты
Были выбраны, для расчета статистической значимости, выборки из разных областей, таких как: медицина, экономика и энергетика. Согласно расчетам, по T-критерию Стьюдента значения точности прогнозирования для разных методов оказались различными, что указывает на их статистическую значимость (p < 0,05).
Сравнивались референсные значения точности прогнозирования и средние значения у обследуемых данных выбранных областей (экономика, медицина, энергетика). Было выявлено следующее:
- Нейронные сети (особенно LSTM) показали отличные результаты в задачах временных рядов.
- Для задач с малыми объемами данных деревья решений и ансамбли демонстрировали более высокую устойчивость к переобучению.
- Регрессионные модели оказались самыми быстрыми в обучении, но имели низкую точность в сравнении с другими методами.
Исходя из полученных данных, можно сделать вывод, что выбор конкретного метода машинного обучения зависит от цели задачи и доступных данных.
Обсуждение
По результатам исследования можно утверждать, что методы машинного обучения способны повысить точность прогнозирования в различных областях. Однако следует отметить, что выбор конкретного алгоритма зависит от особенностей задачи и доступных наборов данных. Например, для небольших датасетов предпочтительнее использовать деревья решений или ансамбли, так как они менее подвержены переобучению. Для задач с большими объемами данных и нелинейными зависимостями лучше подходят нейронные сети [3].
Анализ эффективности машинного обучения требует учета дополнительных факторов, таких как интерпретируемость моделей, время обучения и вычислительные ресурсы. Более детальное исследование может включать сравнение различных архитектур нейронных сетей, оптимизацию гиперпараметров моделей и использование новых технологий, таких как автоматическое машинное обучение (AutoML) [4].
Кроме того, в текущем исследовании не было акцента возможные факторы, которые могут повлиять на качество прогнозирования, такие как качество данных, наличие пропусков и аномалий, а также влияние внешних переменных. Эти факторы могут скорректировать результаты.
Необходимо заметить, что машинное обучение является развивающейся областью, и новые методы постоянно появляются для решения задач прогнозирования. Поэтому дальнейшее исследование должно быть направлено на изучение современных подходов и их практического применения [5].
Заключение
Методы машинного обучения действительно влияют на точность прогнозирования различных процессов и явлений. Поэтому использование данной технологии играет важную роль в развитии различных отраслей, а также в осуществлении своевременной оптимизации процессов для предотвращения ошибок и улучшения качества решений.
Список литературы:
- Семёнова, Е. В. Прогнозирование с помощью ансамблевых методов машинного обучения: практические аспекты применения // Вестник компьютерных и информационных технологий. — 2022. — № 8. — С. 56–63.
- Ткаченко, А. И. Искусственные нейронные сети для прогнозирования: теория и практика. — Москва: Горячая линия — Телеком, 2021. — 256 с.
- Петров, С. В. Эффективность нейронных сетей в задачах прогнозирования больших данных // Вычислительные технологии. — 2022. — Т. 27. — № 3. — С. 89–98.
- Лобанов, А. К. Автоматическое машинное обучение (AutoML): современные подходы и перспективы развития // Программные продукты и системы. — 2023. — № 1. — С. 76–84.
- Кузнецов, М. А. Современные методы машинного обучения для прогнозирования сложных систем // Научно-технический журнал «Информационные технологии». — 2023. — № 4. — С. 152–160.

