Телефон: 8-800-350-22-65
Напишите нам:
WhatsApp:
Telegram:
MAX:
Прием заявок круглосуточно
График работы офиса: с 9:00 до 21:00 Нск (с 5:00 до 19:00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 22(360)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал

Библиографическое описание:
Бекмуратова А.Ю. ОБЕСПЕЧЕНИЕ КАЧЕСТВА ДАННЫХ В АНАЛИТИЧЕСКОЙ ПОДСИСТЕМЕ КОРПОРАТИВНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ СУБЪЕКТА МАЛОГО ПРЕДПРИНИМАТЕЛЬСТВА // Студенческий: электрон. научн. журн. 2026. № 22(360). URL: https://sibac.info/journal/student/360/424107 (дата обращения: 24.06.2026).

ОБЕСПЕЧЕНИЕ КАЧЕСТВА ДАННЫХ В АНАЛИТИЧЕСКОЙ ПОДСИСТЕМЕ КОРПОРАТИВНОЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ СУБЪЕКТА МАЛОГО ПРЕДПРИНИМАТЕЛЬСТВА

Бекмуратова Анастасия Юрьевна

магистрант, Белорусский государственный университет информатики и радиоэлектроники,

Республика Беларусь, г. Минск

Хорошко Виталий Викторович

научный руководитель,

канд. техн. наук, доц., заведующий кафедрой ПИКС, Белорусский государственный университет информатики и радиоэлектроники,

Республика Беларусь, г. Минск

АННОТАЦИЯ

В статье рассмотрена проблема качества данных, используемых в аналитической подсистеме корпоративной информационной системы субъекта малого предпринимательства. Выделены основные характеристики качества: полнота, корректность, согласованность, актуальность и уникальность. Предложена последовательность контроля данных, включающая проверку поступающих записей, нормализацию, выявление пропусков и дубликатов, контроль логических ограничений и оценку интегрального уровня качества. Рассмотрена возможность реализации контроля на серверной стороне приложения на основе Nuxt и визуального представления результатов с использованием Apache ECharts.

ABSTRACT

The article considers the problem of data quality in the analytical subsystem of a small enterprise corporate information system. The main quality characteristics are identified: completeness, accuracy, consistency, timeliness and uniqueness. A data control sequence is proposed, including validation of incoming records, normalization, detection of missing values and duplicates, verification of logical constraints and calculation of an integral quality level. The implementation of control procedures on the server side of a Nuxt-based application and the visualization of results using Apache ECharts are considered.

 

Ключевые слова: качество данных, аналитическая обработка, корпоративная информационная система, малое предпринимательство, валидация, нормализация, дубликаты, Nuxt, Apache ECharts.

Keywords: data quality, data analytics, corporate information system, small business, validation, normalization, duplicates, Nuxt, Apache ECharts.

 

Результаты аналитической обработки зависят не только от используемых методов и программных средств, но и от качества исходных данных. Даже правильно реализованный алгоритм не способен сформировать достоверный отчёт, если входная информация содержит пропуски, повторяющиеся записи, противоречивые значения или сведения за разные временные периоды. Для субъекта малого предпринимательства ошибки аналитики могут привести к неверной оценке спроса, неправильному планированию закупок, искажению финансовых показателей и принятию необоснованных управленческих решений.

В корпоративной информационной системе данные формируются в ходе выполнения повседневных операций. Пользователи создают заказы, изменяют их статусы, регистрируют клиентов, добавляют товары и указывают финансовые значения. Источниками ошибок могут быть ручной ввод, отсутствие обязательных проверок, повторная отправка запроса, неправильное объединение сведений из разных модулей и несвоевременное обновление информации.

Целью исследования является определение методов контроля качества данных, которые могут быть применены при построении аналитической подсистемы корпоративной информационной системы малого предприятия.

Качество данных является комплексной характеристикой. Для его оценки целесообразно использовать несколько взаимосвязанных критериев. Полнота показывает, какая доля обязательных значений присутствует в наборе данных. Корректность характеризует соответствие значений установленному формату и допустимому диапазону. Согласованность отражает отсутствие противоречий между связанными записями. Актуальность определяется соответствием данных рассматриваемому временному периоду. Уникальность показывает отсутствие необоснованного повторения одной и той же сущности или операции.

Показатель полноты может быть определён как отношение количества заполненных обязательных значений к их общему количеству:

q₁ = N_f / N_t,

где N_f — количество заполненных обязательных значений; N_t — общее количество значений, которые должны быть заполнены.

Аналогичным образом могут рассчитываться частные показатели корректности, согласованности, актуальности и уникальности. Для получения обобщённой оценки предлагается использовать интегральный коэффициент качества:

Q = ∑(α_i · q_i),

где Q — интегральный уровень качества данных; q_i — значение отдельного критерия; α_i — коэффициент значимости критерия; сумма коэффициентов α_i равна единице.

Весовые коэффициенты определяются с учётом назначения набора данных. Например, при расчёте финансовых показателей повышенное значение имеют корректность и согласованность. Для оперативного контроля состояния заказов дополнительно возрастает роль актуальности.

Контроль данных должен осуществляться на нескольких этапах. Первичная проверка выполняется при вводе или получении записи. Она включает контроль обязательных полей, типов данных, формата дат, диапазона числовых значений и допустимых перечислений. Например, сумма заказа не должна быть отрицательной, дата выполнения не должна предшествовать дате создания, а статус должен соответствовать одному из состояний, предусмотренных бизнес-процессом.

Следующим этапом является нормализация. Значения, имеющие одинаковый смысл, должны приводиться к единому представлению. Даты сохраняются в согласованном формате, текстовые значения очищаются от лишних пробелов, наименования категорий приводятся к установленному регистру, а денежные показатели — к одной валюте и точности. Отсутствие нормализации может привести к тому, что одинаковые категории будут восприниматься аналитической системой как разные объекты.

Особого внимания требует выявление дубликатов. Повторные записи могут появляться вследствие двойного нажатия кнопки, повторной отправки сетевого запроса или импорта одного файла несколько раз. Для обнаружения дубликатов может применяться сравнение уникальных идентификаторов, сочетаний значимых полей или временных меток. Если полностью одинаковые записи обнаружены в течение небольшого временного интервала, система должна пометить их для проверки либо автоматически исключить повторение.

Контроль согласованности выполняется между связанными сущностями. Каждый заказ должен быть связан с существующим клиентом, товаром или услугой. Итоговая сумма заказа должна соответствовать сумме его позиций с учётом скидок. Статусы должны изменяться в установленной последовательности. Нарушение подобных правил свидетельствует о логической ошибке, даже если каждое отдельное поле имеет корректный формат.

При подготовке аналитических данных необходимо определить порядок обработки пропущенных значений. Универсального способа их заполнения не существует. Если отсутствует критически важное поле, например сумма операции, запись не должна использоваться при расчёте финансового показателя до устранения ошибки. Если пропущено дополнительное свойство, запись может быть включена в общий расчёт, но отнесена к категории «не определено». Выбранный способ обработки должен фиксироваться в правилах аналитической подсистемы.

В корпоративной информационной системе на основе Nuxt контроль может выполняться в серверных маршрутах Nitro до сохранения или агрегации данных. Сервер принимает запрос, проверяет структуру объекта, применяет бизнес-правила и возвращает пользователю описание обнаруженных нарушений. Централизованная серверная проверка обеспечивает одинаковые требования для разных клиентских интерфейсов.

Результаты контроля качества также должны быть доступны пользователям аналитического модуля. Для этого может быть сформирована отдельная информационная панель, содержащая долю корректных записей, количество пропусков, число обнаруженных дубликатов и распределение ошибок по типам. С использованием Apache ECharts динамика интегрального коэффициента качества может отображаться линейной диаграммой, а структура ошибок — столбчатой или круговой диаграммой.

При снижении качества ниже установленного предприятием уровня система должна формировать предупреждение. Пороговые значения не являются универсальными и зависят от критичности данных. Для финансового отчёта требования должны быть более строгими, чем для дополнительной описательной характеристики клиента. Важно, чтобы пользователь видел не только итоговый коэффициент, но и причины его снижения.

Предлагаемый подход предусматривает хранение журнала проверок. В нём фиксируются дата контроля, набор данных, применённые правила, количество проверенных записей и выявленные нарушения. Журнал позволяет отслеживать повторяющиеся проблемы и оценивать результативность мероприятий по их устранению.

Обеспечение качества не должно ограничиваться разовой очисткой базы. Это непрерывный процесс, включающий контроль при вводе, регулярную проверку накопленных сведений, анализ причин возникновения ошибок и корректировку правил. По мере изменения бизнес-процессов набор ограничений также должен обновляться.

Практическое значение предложенного подхода состоит в том, что он позволяет встроить контроль качества непосредственно в аналитическую подсистему корпоративной информационной системы. Пользователь получает возможность оценивать степень надёжности отчёта и учитывать её при принятии решений. Одновременно предприятие получает сведения о проблемных участках информационного процесса.

Таким образом, достоверность аналитических результатов определяется не только выбором метода обработки, но и состоянием исходных данных. Применение критериев полноты, корректности, согласованности, актуальности и уникальности позволяет формализовать оценку качества. Реализация многоэтапной проверки на серверной стороне Nuxt-приложения и визуальный контроль с использованием Apache ECharts создают основу для повышения надёжности аналитического модуля корпоративной информационной системы субъекта малого предпринимательства.

 

Список литературы:

  1. ISO/IEC 25012:2008. Software Engineering — Software Product Quality Requirements and Evaluation — Data Quality Model. — Geneva: International Organization for Standardization, 2008.
  2. DAMA International. DAMA-DMBOK: Data Management Body of Knowledge. — 2nd ed. — Basking Ridge: Technics Publications, 2017. — 624 p.
  3. Batini C., Scannapieco M. Data and Information Quality: Dimensions, Principles and Techniques. — Cham: Springer, 2016. — 500 p.
  4. Redman T.C. Data Quality: The Field Guide. — Boston: Digital Press, 2001. — 241 p.
  5. Nuxt Documentation. Nuxt 4 [Электронный ресурс]. — Официальная документация проекта Nuxt. — Дата доступа: 15.06.2026.
  6. Apache ECharts Handbook [Электронный ресурс]. — Официальная документация проекта Apache ECharts. — Дата доступа: 15.06.2026.