Статья опубликована в рамках: Научного журнала «Студенческий» № 11(139)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
ОБЗОР ИНСТРУМЕНТОВ ОЦЕНКИ УРОВНЯ ЭКОНОМИЧЕСКОГО РАЗВИТИЯ РЕГИОНОВ
REVIEW OF TOOLS FOR ASSESSING THE LEVEL OF ECONOMIC DEVELOPMENT OF REGIONS
Mikhail Palyga
student, Department of Information Systems and Digital Technologies, Orel State University named after I.S. Turgenev,
Russia, Orel
Anastasia Efanova
student, Department of Information Systems and Digital Technologies, Orel State University named after I.S. Turgenev,
Russia, Orel
Olga A. Savina
scientific advisor, Doctor of Economics, Professor of the Department of Information Systems and Digital Technologies, Orel State University named after I.S. Turgenev,
Russia, Orel
АННОТАЦИЯ
В данной статье рассматриваются инструменты и технологии, применимые для оценки уровня экономического развития регионов. Рассмотрены некоторые инструменты для работы с большими данными и визуализации данных.
ABSTRACT
This article examines the tools and technologies that can be used to assess the level of economic development of regions. Some tools for working with big data and data visualization are considered.
Ключевые слова: статистика, оценка, анализ, большие данные, уровень экономического развития регионов, инструменты для анализа данных.
Keywords: statistics, assessment, analysis, big data, regional level of economic development, data analysis tools.
Введение
В отечественной экономике укрепляются те же тенденции современного экономического развития, которые набирают силу в странах Запада и Востока: глобализация, развитие сферы услуг, масштабная информатизация общества, развитие сетевых форм организации, исчерпание традиционных источников социально-экономического роста. В этих условиях является актуальным поиск новых путей и решающих факторов регионального саморазвития[2].
В настоящее время накапливается всё больше и больше информации в цифровом виде, в том числе и информации по экономике регионов. В работе с такой информацией нам могут помочь технологии больших данных.
Целью работы является обзор технологий и инструментов, применимых для оценки уровня экономического развития регионов на основе технологии больших данных.
Технологии больших данных
Большие данные — серия подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объёмов и значительного многообразия для получения воспринимаемых человеком результатов, эффективных в условиях непрерывного прироста, распределения по многочисленным узлам вычислительной сети, сформировавшихся в конце 2000-х годов, альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence[1].
Технологии больших данных можно разделить на две категории:
Технологии оперативных больших данных (Технологии сбора больших данных). Оперативные данные - это данные, которые человек генерирует каждый день. Это могут быть данные социальных сетей, оплаченные в Интернет покупки и т.д. Также эти данные можно считать как необработанные данные, передаваемые технологиям анализа больших данных.
Технологии аналитических больших данных (Технологии анализа больших данных). Немного более сложные, чем оперативные данные. Сюда относят исследование массивов данных, имеющих важное значение для принятия решений (например, в бизнесе). К примеру, сюда можно отнести фондовые рынки, прогноз погоды, анализ временных рядов, данные медицинских наблюдений.
Hadoop
Apache Hadoop - это фреймворк с открытым исходным кодом, который используется для хранения и обработки больших наборов данных (от гигабайт до петабайт). Hadoop вместо использования одного мощного компьютера использует кластер из нескольких машин, что позволяет работать в параллельном режиме.
Сторонние приложения могут размещать собранные ими данные, связавшись с NameNode посредством API Hadoop. NameNode отслеживает структуру каталога файлов и места размещения блоков каждого файла. Блоки файлов распределены по узлам DataNodes. Для получения данных из распределенной системы запускается работа MapReduce, состоящая из множества задач map и reduce. Map задачи запускаются на каждом узле для предварительной обработки данных, а reduce задачи агрегируют эти данные.
Hadoop пользуются такие компании как MapR, Microsoft, Intel, IBM, Cloudera, Hortonworks[7].
Язык R
R - бесплатная программная среда для статистических вычислений и работы с графикой. R является и языком программирования и средой используемой пользователями (не обязательно программистами) для интерактивного статистического анализа и моделирования[10]. Язык появился в 1993 году.
Одно из достоинств языка R в том, что с его помощью получаются графики высокого качества, включая при необходимости математические знаки и формулы. При этом у пользователя сохраняется возможность полной их кастомизации.
Язык широко поддерживается сформированным сообществом. Выпускаются как частые релизы основной команды разработчиков R, так и тысячи пакетов, написанных сообществом языка и доступных на CRAN (Comprehensive R Archive Network). Помимо этого, R также поддерживается и крупными компаниями. На начало 2021 года на CRAN доступно 17 303 пакета[6].
Как сам язык, так и множество сторонних пакетов подходят для моделирования и анализа данных. R упрощает работу аналитика данных, предоставляя инструменты для обработки данных, их визуализации, моделирования. В R операции векторизированные. Это значит, что производить операции с векторами и матрицами будет довольно легко.
Данный инструмент может быть очень полезен в работе по оценке уровня экономического развития регионов. Особенно полезно наличие дополнительных устанавливаемых библиотек, например, таких как dplyr, ggplot2, psych.
Plotly
Plotly – бесплатная библиотека с открытым исходным кодом для построения интерактивных графиков и карт[3].
В основном используется для более быстрого и эффективного создания графиков. API представлены для Python, R, MATLAB, Node.js, Julia, Arduino и REST API. Выпущен в 2012 году. Написан на JavaScript.
Использование данной библиотеки может помочь с визуализацией данных показателей экономического развития регионов. В сочетании с RStudio может получиться мощный инструмент для визуализации полученных данных.
Shiny
Shiny - это пакет (фреймворк) для языка R, который позволяет строить интерактивные веб-приложения, используя сам язык R. Для построения приложений не требуется знание HTML, CSS и JavaScript.
В таких интерактивных приложениях есть возможность гибкой, динамической настройки получаемых результатов: экспорт диаграмм, масштабирование, выбор нужных видов диаграмм и многое другое[4].
Пакет Shiny нашел широкое применение в период пандемии коронавируса в 2020 году. Было создано множество веб-приложений для отображения статистики по заболеваемости и прочим данным о ходе пандемии в мире[5].
Использование данного пакета для оценки уровня экономического развития регионов может значительно повысить удобство процесса анализа данных за счет интерактивности (например, выбор данных за определенный период времени).
Заключение
Рассмотрены некоторые инструменты и технологии больших данных и возможности их применения для оценки уровня экономического развития регионов.
Список литературы:
- А. Петров, Big Data от А до Я. Часть 1: Принципы работы с большими данными, парадигма MapReduce, 21.09.2015 [Электронный ресурс]. – URL: https://habr.com/ru/post/267361/ (дата обращения 10.03.2021)
- Видяпин В.И. Степанов М.В. Региональная экономика: Учебник. - М.: ИНФРА-М. - (100 лет РЭА им. Г.В. Плеханова). 2007
- Визуализация данных в Python вместе с Plotly, 26.01.2019 [Электронный ресурс]. – URL: https://proglib.io/p/plotly/ (дата обращения 14.03.2021)
- Визуализация статистики производительности оборудования с R – Shiny, 18.03.2015 [Электронный ресурс]. – URL: https://habr.com/ru/post/253419/ (дата обращения 14.03.2021)
- Antoine Soetewey. Top 100 R resources on Novel COVID-19 Coronavirus, 12.03.2020 [Электронный ресурс]. – URL: https://towardsdatascience.com/top-5-r-resources-on-covid-19-coronavirus-1d4c8df6d85f (дата обращения 14.03.2021)
- Contributed Packages. CRAN. [Электронный ресурс]: – URL: https://cran.r-project.org/web/packages/index.html (дата обращения 14.03.2021)
- Hadoop. Википедия. Свободная энциклопедия. [Электронный ресурс]: – URL: https://ru.wikipedia.org/wiki/Hadoop (дата обращения 10.03.2021)
- Neelam Tyagi, Top 10 Big Data Technologies in 2020], 11.05.2020 [Электронный ресурс]: – URL: https://www.analyticssteps.com/blogs/top-10-big-data-technologies-2020 (дата обращения 14.03.2021)
- R. Википедия.Свободная энциклопедия. [Электронный ресурс]: – URL: https://en.wikipedia.org/wiki/R_(programming_language) (дата обращения 14.03.2021)
Оставить комментарий