Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: CCXII Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 15 мая 2025 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Шугурова Д.М. СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. CCXII междунар. студ. науч.-практ. конф. № 9(211). URL: https://sibac.info/archive/meghdis/9(211).pdf (дата обращения: 09.06.2025)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

СРАВНИТЕЛЬНЫЙ АНАЛИЗ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ ВРЕМЕННЫХ РЯДОВ

Шугурова Дарья Максимовна

студент, кафедра информационных систем, Государственный университет управления,

РФ, г. Москва

Крамаренко Инна Владимировна

научный руководитель,

канд. экон. наук, доц., Государственный университет управления,

РФ, г. Москва

COMPARATIVE ANALYSIS OF TIME SERIES FORECASTING SOFTWARE

 

Daria Shugurova

student, Department of Information Systems, State University of Management,

Russia, Moscow

Inna Kramarenko

scientific supervisor, candidate of Sciences in Economics, associate professor, State University of Management,

Russia, Moscow

 

АННОТАЦИЯ

Статья посвящена обзору программных продуктов, предназначенных для моделирования и прогнозирования временных рядов. Для сравнения выделяется три группы программных продуктов: аналитические платформы, аналитические продукты и библиотеки языков программирования для реализации конкретных задач обработки данных. Среди сравниваемого программного обеспечения особенно выделено российское.

ABSTRACT

The article is devoted to an overview of software products designed for modeling and forecasting time series. For comparison, there are three groups of software products: analytical platforms, analytical products, and programming language libraries for implementing specific data processing tasks. The Russian software is particularly highlighted among the compared software.

 

Ключевые слова: анализ данных, прогнозирование, временной ряд, аналитическая платформа, аналитическое программное обеспечение.

Keywords: data science, forecasting, time series analysis, analytical platform, analytical software.

 

«Современный этап развития российского государства выдвигает в число первоочередных задачу перехода к стабильному, предсказуемому и эффективному развитию экономики страны, что, в свою очередь, невозможно без специальных знаний в области методологии, методики и технологии составления научно обоснованных макро- и микроэкономических прогнозов социально-экономического развития» [1, с. 3]. Так, в условиях постоянно меняющейся экономической ситуации, как в России, так и в мире, способность прогнозирования является критически важной для бизнеса, государственных органов и потребителей. В настоящее время в связи со стремительным ростом объемов данных, которые нужно обрабатывать и анализировать, на рынке существует большое количество различных программных сред и инструментов для этих целей. Выбор программного обеспечения в первую очередь зависит от конкретных особенностей решаемых задач, навыков исследователя, ресурсов и возможностей организации [17].

Рассмотрим три категории программного обеспечения: аналитические платформы, где упор сделаем на отечественное ПО, аналитические продукты и языки программирования. Аналитическая платформа реализует полный цикл работы с данными и с точки зрения архитектуры представляет собой 4 уровня: уровень транзакционных систем; уровень хранилищ данных; уровень витрин данных и уровень аналитических приложений. Аналитические продукты – специализированное программное обеспечение для реализации функционала интеллектуального анализа данных.

Среди российских аналитических платформ можно выделить аналитическую платформу Форсайт и low-code платформу Loginom. Наиболее известными аналитическими платформами, которые ушли с российского рынка программного обеспечения, являются: SAS, SAP, Oracle. Также среди иностранного программного обеспечения, которое используется частными лицами и рядом компаний для решения аналитических задач является платформа Microsoft Office и аналитический продукт Excel. По оценкам экспертов от 0,5 до 1,5 миллиардов человек по всему миру используют Excel, хотя точные цифры разнятся [18].

К аналитическим продуктам, которые будут рассмотрены в данной статье, отнесем три продукта: Excel, Loginom, Форсайт.

Excel можно использовать для решения простых задач прогнозирования на основе моделей временных рядов: тренды, скользящие средние, экспоненциальное сглаживание. Платформа подойдет экономистам и менеджерам для предварительного анализа данных и построения предварительных моделей и прогнозов [2, 3, 4].

Аналитическая платформа Loginom — это отечественная low-code платформа, мощный инструмент для анализа данных, который предоставляет широкие возможности для работы с временными рядами [5]. Платформу можно использовать для решения продвинутых задач прогнозирования с использованием машинного обучения. Помимо моделей простой регрессии в Loginom представлены такие модели временных рядов как ARIMA, SARIMA, метод наивного прогноза, прогнозирование на основе регрессии и Machine Learning-модели, под которыми понимается прогнозирование с использованием нейронных сетей.

 Форсайт — это российская аналитическая платформа, разработанная для анализа данных, прогнозирования и моделирования. Она активно используется в бизнесе, государственном управлении и научных исследованиях. Платформа хорошо подойдет для комплексного анализа данных, командной работы, автоматизации процессов, работы с большими данными и для организаций, ориентированных на отечественное ПО [6]. В Форсайт временные ряды размещаются в едином табличном пространстве с возможностью объединения для графического представления, анализа и прогнозирования. В платформе доступно построение моделей временных рядов с помощью математических формул, экстраполяции, регрессионного анализ, интеграции с языками программирования R, Python.

Сравнительный анализ трех платформ представлен в таблице 1.

Таблица 1.

Сравнительный анализ аналитических платформ

Критерий

Excel

Loginom

Форсайт

Лицензирование

Коммерческий (MS Office)

Коммерческий (есть бесплатная версия)

Коммерческий(российский)

Сложность освоения

Низкая

Средняя

Средняя

Методы анализа временных рядов

Тренды, модели сглаживания

Модели простой регрессии, ARIMA, SARIMA, GARCH, спектральный анализ, нейронные сети

Модели простой регрессии, ARIMA, SARIMA, GARCH, спектральный анализ, нейронные сети

Машинное обучение

-

+

+

Предобработка данных

Ручная

Автоматизированная

Автоматизированная

Визуализация

Базовые графики

Продвинутые графики

Продвинутые графики

Работа с Big Data

- (до 1 млн строк)

+

+

Автоматизация

+ (через VBA)

+

+

Российское ПО

-

+

+

Оптимальное применение

Разовые расчеты, обучение сотрудников

Промышленный анализ данных

Государственные организации

 

К рассматриваемым аналитическим продуктам отнесем три статистических пакета: Gretl, Statistica, SPSS. 

Аналитический продукт Gretl (GNU Regression, Econometrics and Time-series Library) — свободно распространяемое программное обеспечение, которое в большей степени представляет собой среду для реализации эконометрических моделей. Устаревший недружественный интерфейс снижает популярность продукта среди экономистов и менеджеров. Программное обеспечение используется в качестве инструментальной среды для обучения в университетах при изучении таких дисциплин как «Эконометрика», «Анализ данных». В Gretl есть модели линейной и нелинейной регрессии, авторегрессионные модели класса ARIMA, SARIMA или GARCH [7]. Для моделирования временных рядов в Gretl следует иметь специальные знания в области теории вероятностей и математической статистики, эконометрики. Продукт дает возможность использования тестов, например, проверка на однородность, на вид функции распределения, тесты на стационарность (Дики-Фуллера).

Аналитический продукт Statistica (TIBCO Statistica) можно отнести к статистическому пакету, который реализует большое число инструментов интеллектуального анализа данных, в том числе и для прогнозирования временных рядов. Программный продукт имеет удобный интерфейс и простое меню, которое подойдет менеджерам и экономистам для проведения исследований [8, 9, 10, 11].

Аналитический продукт SPSS (IBM SPSS Statistics) относится к статистическим пакетам, который получил широкое распространение при реализации социологических опросов и в маркетинге. В SPSS есть все методы анализа временных рядов (тренды, авторегрессионные модели, модели сглаживания). Программный продукт имеет понятный интерфейс и меню, дает широкие возможности для проведения исследований, доступен пользователям пользователей без навыков программирования и имеет возможность интеграции с корпоративными BI-системами IBM [12, 13, 14, 15]. К минусам аналитического продукта можно отнести проблему структурирования и управления отчетами при большом количестве экспериментов, в SPSS отсутствует удобная система организации файлов и метаданных.

Сравнительный анализ трех статистических пакетов представлен в таблице 2.

Таблица 2.

Сравнительный анализ статистических пакетов

Критерий

Gretl

Statistica

Statgraphics

SPSS

Лицензирование

Бесплатный

Коммерческий

Коммерческий

Коммерческий

Сложность освоения

Средняя

Средняя

Низкая

Низкая

Методы анализа  временных рядов

Модели простой регрессии, ARIMA, SARIMA, GARCH, спектральный анализ, статистические тесты

Модели простой регрессии, ARIMA, SARIMA, GARCH, спектральный анализ, нейронные сети

Модели простой регрессии, ARIMA, SARIMA, GARCH, спектральный анализ, нейронные сети

Модели простой регрессии, ARIMA, спектральный анализ

Машинное обучение

+ (ограничено)

+

-

-

Предобработка данных

+ (базовая)

+

+

+

Визуализация

Базовые графики

Продвинутые графики

Продвинутые графики

Базовые графики

Работа с Big Data

-

+

-

-

Автоматизация

+

-

-

+ (частичная)

Оптимальное применение

Экономические исследования

Научные исследования

Промышленные приложения

Социологические исследования

 

Языки программирования R и Python широко используются в анализе данных, но имеют разные сильные стороны в работе с временными рядами [16].

Для временных рядов в языке программирования R реализованы классические методы анализа временных рядов: сглаживание, тренды, авторегрессионные модели ARIMA. С помощью библиотек ggplot2 и plotly можно выполнить красивую визуализацию, для авторегрессионных моделей построить функции ACF/PACF.

В языке программирования R нет таких мощных библиотек, как scikit-learn или TensorFlow. Глубокое обучение (Keras, LSTM) также подключается через Python. R медленнее на больших данных. В нем нет аналогов pandas и сложнее работать с распределенными вычислениями. Данный язык программирования менее универсальный и за пределами анализа данных используется реже.

Язык программирования Python гибкий и универсальный. В нем можно совмещать прогнозирование с веб-скрапингом, API и ML. Python легко справляется с большим объемом данных. Здесь доступна интеграция с Dask, Spark и легче встроить модель в продакшен (Flask, FastAPI). К недостаткам Python можно отнести его неудобство для классических методов. Например, ARIMA в statsmodels сложнее настроить, чем в R, а также нет аналога forecast с такой автоматизацией.

Визуализация в Python требует больше кода. Так, matplotlib/seaborn менее интуитивны, чем ggplot2. Данный язык программирования имеет меньше готовых статистических тестов чем R, например, для анализа остатков. Сравнительный анализ языков программирования для реализации анализа временных рядов представлен в таблице 3.

Таблица 3.

Сравнительный анализ языков программирования

Критерий

R

Python

Классические методы

+ (forecast, tseries)

- (но statsmodels есть)

Машинное обучение

-

+ (sklearn, TensorFlow)

Работа с Big Data

- (медленнее)

+ (pandas, Spark)

Визуализация

+ (ggplot2)

- (требует больше кода)

Продакшен

- (сложнее)

+ (Flask, Docker)

 

В заключении отметим, что существует широкий спектр доступного программного обеспечения для прогнозирования временных рядов, каждое из которых имеет свои особенности, возможности и уровень подготовки, необходимый для их эффективного использования [17]. Microsoft Excel - популярный выбор для простых задач анализа данных, в то время как Loginom, Форсайт и SPSS — это специализированное программное обеспечение, требующее специальной подготовки и опыта работы со статистическими методами. Важно отметить, что лучший инструмент для конкретной задачи зависит от конкретных потребностей и требований пользователя.

 

Список литературы:

  1. Писарева О.М. Методы прогнозирования развития социально-экономических систем: учеб. пособие. М.: Высш. шк., 2007. - 591 с.
  2. Microsoft Excel official website [Электронный ресурс] // Microsoft: сайт. – URL: https://products.office.com/en-us/excel (дата обращения: 16.04.2025).
  3. Вадзинский Р.Н. Статистические вычисления в среде Excel: Библиотека пользователя. Санкт-Петербург: Питер, 2010. — 608 с.
  4. Microsoft Excel tutorial for legal research [Электронный ресурс] // GCFLearnFree.org: сайт. – URL: https://www.gcflearnfree.org/excel-for-legal-professionals/ (дата обращения: 25.04.2025).
  5. Loginom — руководство пользователя [Электронный ресурс] // help.loginom.ru: сайт. – URL: https://help.loginom.ru/userguide/index.html (дата обращения: 27.04.2025).
  6. Форсайт. Аналитическая платформа [Электронный ресурс] // help.loginom.ru: сайт. – URL: https://help.fsight.ru/ru/ (дата обращения: 27.04.2025).
  7. Gretl User’s Guide [Электронный ресурс] // gretl.sourceforge.net: сайт. – URL: https://gretl.sourceforge.net/gretl-help/gretl-guide.pdf (дата обращения: 22.04.2025).
  8. Salkind N.J. Statistics for People Who (Think They) Hate Statistics. 7th end. SAGE, 2020. — 512 p.
  9. Чурилова Э.Ю., Салин В.Н. Статистический анализ данных цифровой экономики в системе "STATISTICA". Москва: КноРус, 2019. — 238 с.
  10. Боровиков В.П. STATISTICA. Искусство анализа данных на компьютере: для профессионалов. 2-е изд. Санкт-Петербург: Питер, 2003. — 688 с.
  11. Statistics library/Resources [Электронный ресурс] // www.statgraphics.com: сайт. – URL: https://www.statgraphics.com/Statistics-library (дата обращения: 28.04.2025).
  12. IBM SPSS Statistics [Электронный ресурс] // IBM: официальный сайт. – URL: https://www.ibm.com/analytics/spss-statistics-software (дата обращения: 06.02.2023).
  13. Наследов А.Д. SPSS 19: профессиональный статистический анализ данных. Санкт-Петербург: Питер, 2011. – 400 с.
  14. Бююль А., Цефель П. SPSS: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей. Санкт-Петербург: ДиаСофтЮП, 2005. – 608 с.
  15. Field A. Discovering Statistics Using SPSS for Windows: Advanced Techniques for Beginners. London: Sage Publications, 2000. – 512 p.
  16. Груздев А.В. Прогнозное моделирование в IBM SPSS Statistics, R и Python. Метод деревьев решений и случайный лес. Москва: ДМК Пресс, 2018. — 642 с.
  17. Черткова Е.А. Статистика. Автоматизация обработки информации: учеб. пособие для вузов / под общ. ред. Е.А. Чертковой. 2-е изд., испр. и доп. Москва: Юрайт, 2017. — 195 с.
  18. Excel is still popular because it democratised control over data [Электронный ресурс] // www.senacea.co.uk: официальный сайт. – URL: https://www.senacea.co.uk/post/excel-users-how-many (дата обращения: 06.02.2023).
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий