Статья опубликована в рамках: Научного журнала «Студенческий» № 6(344)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
РАЗРАБОТКА ПРОТОТИПА ИНФОРМАЦИОННО-АНАЛИТИЧЕСКОЙ СИСТЕМЫ ДЛЯ МОНИТОРИНГА
АННОТАЦИЯ
В условиях импортозамещения в России и действия нормативных ограничений на использование зарубежного программного обеспечения задача планирования миграции автоматизированных рабочих мест (АРМ) на отечественные операционные системы становится одним из ключевых направлений развития ИТ‑инфраструктур государственных и корпоративных заказчиков. При массовых миграционных проектах основным узким местом выступает инвентаризация и последующий анализ характеристик сотен и тысяч рабочих станций, необходимый для формирования волн миграции и оценки рисков. Традиционные системы мониторинга, такие как Zabbix и Prometheus, эффективны для непрерывного контроля, но оказываются избыточными и неудобными при разовом сборе расширенных характеристик АРМ и их интеллектуальной обработке в консалтинговых сценариях. В статье рассматривается разработанный прототип информационно‑аналитической системы, ориентированной на разовый heartbeat‑сбор инвентаризационных данных с АРМ под управлением Windows и последующее применение методов искусственного интеллекта для кластеризации рабочих мест по волнам миграции. Серверная часть реализована на базе Flask и PostgreSQL с использованием JSONB‑хранилища для метрик, а клиентская утилита на C++ формирует структурированный JSON‑отчёт о конфигурации устройства и передаёт его на REST‑endpoint /api/devicereport. Интеллектуальный модуль применяет метод KMeans‑кластеризации к признакам (объём оперативной памяти, количество ядер, наличие HDD, статус Secure Boot, число периферийных устройств) и формирует управленческий отчёт, включая интерпретацию результатов с помощью крупной языковой модели. Показано, что предложенный подход позволяет автоматизировать часть аналитической работы при подготовке миграционных проектов и может быть использован как легковесный модуль в составе корпоративной информационной системы.
ABSTRACT
The policy of import substitution in the Russian IT sector and regulatory restrictions on the use of foreign software have led to large-scale projects for migrating automated workstations from Windows to domestic operating systems. A key challenge in such projects is the one-time collection and analysis of extended inventory data for hundreds or thousands of devices in order to assess readiness for migration and to plan migration waves. Traditional monitoring systems such as Zabbix and Prometheus are optimized for continuous performance monitoring and SLA control, but are often too heavy and inconvenient for one-time inventory collection and subsequent intelligent analytics. The article presents a prototype of an information-analytical system designed for one-time heartbeat-based collection of inventory data from automated workstations running Windows, followed by the application of artificial intelligence methods to cluster devices into migration waves. The server side is implemented using Flask and PostgreSQL with JSONB storage for metrics, while a lightweight client utility written in C++ forms a structured JSON report on the device configuration and sends it to a dedicated REST endpoint. The intelligent analysis module uses the KMeans clustering algorithm on features such as RAM size, CPU core count, disk configuration, Secure Boot status, and peripheral devices, and generates a management-oriented report, including natural-language interpretation of the results using a large language model. The proposed approach reduces the share of manual analytical work, increases the transparency and justification of migration decisions, and can be used as a lightweight component within a broader corporate information system for import substitution projects.
Ключевые слова: импортозамещение, мониторинг ИТ‑инфраструктуры, автоматизированное рабочее место, Astra Linux, heartbeat‑данные, Flask, PostgreSQL, KMeans, искусственный интеллект.
Keywords: import substitution, IT infrastructure monitoring, automated workstation, inventory, heartbeat data, Flask, PostgreSQL, JSONB, KMeans, artificial intelligence, migration planning, clustering.
Введение
Политика импортозамещения в российской ИТ‑сфере и действие Постановления Правительства РФ № 1236 существенно изменили подход к развитию корпоративных и государственных ИТ‑инфраструктур, стимулируя отказ от зарубежного программного обеспечения и переход на отечественные операционные системы, в частности Astra Linux. Для государственных структур целевые показатели уровня локализации уже измеряются десятками процентов, что к 2026 году приводит к необходимости массовой миграции существующих автоматизированных рабочих мест с Windows на российские ОС. В таких проектах ключевым этапом выступает инвентаризация парка АРМ: требуется собрать и проанализировать характеристики процессора, объём оперативной памяти, параметры дисковой подсистемы, особенности загрузки и подключённой периферии для сотен и тысяч устройств.
На практике эта задача часто решается либо вручную, через табличные шаблоны и опросы подразделений, либо с использованием тяжеловесных систем управления, вроде SCCM, что увеличивает трудозатраты и усложняет внедрение на разово обследуемых площадках. При этом традиционные системы мониторинга (Zabbix, Prometheus, отечественные платформы класса wiSLA, Astra Monitoring и др.) ориентированы преимущественно на непрерывный контроль производительности и доступности, а не на быстрый разовый сбор расширенной инвентаризации с последующей интеллектуальной аналитикой. В консалтинговых компаниях значительная часть времени уходит на ручную обработку и группировку характеристик АРМ, формирование волн миграции и оценку рисков, что при больших объёмах данных приводит к задержкам и ошибкам планирования.
Целью работы является разработка прототипа информационно‑аналитической системы, обеспечивающей разовый heartbeat‑сбор инвентаризационных данных с АРМ под управлением Windows и использование методов искусственного интеллекта для автоматизированного формирования волн миграции при переходе на отечественные ОС. Для достижения поставленной цели в курсовом проекте были решены задачи анализа существующих систем мониторинга, выбора формата сбора данных, проектирования архитектуры веб‑приложения на базе Flask и PostgreSQL, а также разработки модуля интеллектуального анализа миграций с кластеризацией и генерацией отчётов
Научная новизна предложенного подхода заключается в интеграции разового heartbeat‑сбора характеристик с ИИ‑обработкой в рамках единого веб‑сервиса, что позволяет сократить долю ручного труда аналитиков и повысить обоснованность решений по планированию миграционных волн в условиях импортозамещения. Практическая значимость прототипа состоит в возможности применения лёгкого инструмента инвентаризации и анализа как дополнения к существующим системам мониторинга, без необходимости развёртывания полнофункциональной платформы на стороне заказчика.
- Мониторинг ИТ‑инфраструктуры и задачи миграции АРМ
Мониторинг ИТ‑инфраструктуры традиционно определяется как комплекс мероприятий по сбору, обработке и анализу данных о состоянии аппаратных и программных компонентов, обеспечивающий своевременное обнаружение инцидентов, прогнозирование отказов и оптимизацию использования ресурсов. Развитие импортозамещения придаёт мониторингу дополнительное измерение, связанное с оперативной оценкой готовности инфраструктуры к миграции на отечественные решения: требуется не только контролировать текущие метрики, но и иметь достоверный инвентаризационный срез рабочих мест.
По методу сбора данных выделяют три основных вида мониторинга: пассивный, активный и гибридный. Пассивный мониторинг предполагает, что сами устройства инициируют отправку данных (heartbeat‑пакеты, SNMP‑trap‑сообщения, JSON‑callback‑запросы), что снижает нагрузку на сеть и хорошо подходит для разовой инвентаризации крупных парков АРМ. Активный мониторинг (polling) основан на регулярных опросах устройств со стороны центральной системы (например, Zabbix через WMI для Windows), обеспечивая детальный контроль, но создавая значительную нагрузку при большом числе узлов. Гибридные подходы комбинируют периодический опрос с событийнymi уведомлениями и используются в крупных корпоративных средах и SLA‑ориентированных решениях.
В контексте миграции АРМ пассивный heartbeat‑сбор оказывается наиболее удобным: достаточно один раз запустить клиентскую утилиту на рабочем месте, чтобы передать на сервер полный набор характеристик без постоянного агентского сопровождения. Ключевыми для миграционных проектов метриками становятся параметры процессора и оперативной памяти, тип и объём системного диска, режим загрузки (UEFI/Legacy) и статус Secure Boot, наличие критической периферии и специфического программного обеспечения. Эти данные позволяют оценить, насколько устройство соответствует требованиям целевой ОС, спрогнозировать производительность после перехода и выявить потенциальные риски, связанные с несовместимостью драйверов или ограничениями безопасности.
- Ограничения существующих систем мониторинга в задачах миграции
Популярные открытые и коммерческие системы мониторинга, такие как Zabbix и Prometheus, а также отечественные решения wiSLA, «Наблюдатель» и Astra Monitoring, успешно используются для постоянного контроля серверов, виртуальной инфраструктуры и сетевого оборудования, но имеют ряд ограничений при решении задач разовой инвентаризации АРМ для миграции. Zabbix предоставляет развитые механизмы инвентаризации, однако требует развёртывания полноценного сервера, установки агентов на каждое устройство, настройки шаблонов и последующей выгрузки данных во внешние аналитические инструменты, что создаёт избыточные накладные расходы для одноразовых консалтинговых проектов
Prometheus ориентирован на сбор временных рядов и анализ динамики метрик в режиме близком к реальному времени, но не предназначен для хранения сложных структур с десятками атрибутов на объект (например, перечень USB‑устройств или детальная разметка дисков), что ограничивает его применение в качестве источника инвентаризационных данных для миграции рабочих мест. Отечественные решения, такие как wiSLA и Astra Monitoring, дополнительно фокусируются на SLA‑аналитике, корреляции событий и управлении инфраструктурой на базе Astra Linux, выполняя роль долгоживущего мониторингового слоя и пост‑миграционного контроля.
Общим недостатком перечисленных систем в рассматриваемом сценарии является сложность и «тяжесть» внедрения при разовом обследовании: необходимость установки агентов, интеграции с существующей инфраструктурой заказчика, настройки шаблонов и экспорта зачастую превышает сроки самого миграционного проекта. Кроме того, в составе этих платформ, как правило, отсутствуют готовые механизмы ИИ‑кластеризации рабочих мест по волнам миграции с генерацией текстовых рекомендаций, а любые попытки встроить машинное обучение требуют разработки дополнительной прослойки и усложняют архитектуру решения
Архитектура и реализация прототипа информационно‑аналитической системы
Предлагаемый прототип направлен на решение именно узкой задачи разового сбора и интеллектуальной обработки инвентаризационных данных, что обусловило выбор облегчённой архитектуры на базе веб‑приложения Flask и СУБД PostgreSQL. Клиентская часть реализована в виде утилиты под Windows, написанной на C++, которая опрашивает операционную систему и аппаратную конфигурацию автоматизированного рабочего места, формируя иерархический JSON‑отчёт с разделами deviceinfo, systemcharacteristics, users, peripheraldevices и collectioninfo.
После завершения опроса утилита выполняет одноразовый HTTP POST‑запрос к REST‑endpoint’у /api/devicereport, передавая сформированный JSON‑объект в формате application/json. На стороне сервера запрос обрабатывается в рамках Blueprint‑модуля metrics: из тела запроса извлекается JSON‑payload, определяются вложенные разделы, и специализированная функция extractdevicereportdata нормализует данные, формируя плоский набор полей, соответствующий конфигурации METRIC_CONFIG для типа devicereport.
В базе данных PostgreSQL все метрики хранятся в универсальной таблице Metric, где тип записи (checktype), идентификатор устройства (cn), временная метка и поле data формата JSONB позволяют использовать единый механизм фильтрации, просмотра и экспорта для различных категорий данных, включая heartbeat‑отчёты. Такой подход делает схему расширяемой: добавление новых типов метрик не требует изменения структуры таблицы, достаточно обновить конфигурацию METRIC_CONFIG и соответствующие обработчики. Веб‑интерфейс предоставляет страницы для просмотра сырых отчётов devicereport с возможностью выбора отображаемых колонок, применения временных и полевых фильтров, а также экспорта отфильтрованных данных в CSV объёмом до 10 000 записей Модуль интеллектуального анализа миграции
Ключевой особенностью предложенной системы является модуль интеллектуального анализа миграции, реализованный как отдельный компонент серверной части и отвечающий за переход от сырых инвентаризационных данных к управленческим рекомендациям по формированию миграционных волн. Функция analyzemigrationwaves обращается к таблице Metric, выбирает все записи типа devicereport и извлекает из поля data ключевые характеристики, формируя датафрейм pandas с числовыми признаками.
В качестве признаков используются объём оперативной памяти, количество ядер процессора, наличие HDD‑диска, статус Secure Boot, количество подключённых периферийных устройств и ряд дополнительных параметров, влияющих на сложность миграции. Перед применением алгоритма KMeans признаки стандартизируются с помощью StandardScaler, а далее выполняется кластеризация на три группы, которым интерпретационно присваиваются номера волн миграции (первая, вторая и третья волны). Для каждого кластера рассчитывается сводная статистика, формируется компактная Markdown‑таблица с характеристиками волны, а также распределение количества устройств по кластерам.
Для повышения удобства восприятия результатов модуль использует крупную языковую модель (LLM), к которой через API передаются агрегированные данные по кластерам и общее количество АРМ. Модель генерирует текстовый аналитический отчёт в формате Markdown, в котором описываются особенности каждой волны, предлагается рекомендуемый порядок миграции, выделяются группы устройств с повышенным риском и формулируются практические рекомендации для ИТ‑специалистов. В случае недоступности внешнего LLM‑сервиса предусмотрен резервный генератор отчётов, формирующий структурированный текст на основе тех же статистических данных.
Сценарий применения и результаты
Типовой сценарий использования прототипа начинается на стороне заказчика: на выбранных автоматизированных рабочих местах под управлением Windows запускается поставляемый бинарный файл утилиты сбора, который однократно формирует JSON‑отчёт и отправляет его на сервер прототипа. После завершения этого этапа администратор или аналитик получает доступ к странице devicereport, где может убедиться в корректности поступивших данных, настроить фильтры по доменам, FQDN, параметрам дисковой подсистемы и безопасности, а при необходимости выгрузить выгрузку в CSV для дополнительного анализа.
На следующем шаге в веб‑интерфейсе инициируется запуск модуля интеллектуального анализа миграций: функция analyzemigrationwaves формирует кластеры устройств и генерирует отчёт, который отображается на отдельной странице migration_waves.html. Пользователь видит таблицу распределения АРМ по волнам с ключевыми характеристиками и текстовое пояснение, позволяющее принять решение о порядке миграции, определить первую очередь (например, устройства с более высоким ресурсом и меньшими рисками) и вынести в последующие волны рабочие места с потенциально проблемной конфигурацией.
Хотя в курсовом проекте прототип тестировался на ограниченном наборе данных (порядка сотни записей), уже на этом уровне видно, что автоматизация кластеризации и генерации отчётов позволяет существенно сократить объём ручного анализа таблиц и повысить прозрачность обоснования миграционных решений. В перспективе при масштабировании на несколько сотен или тысяч АРМ эффект от автоматизации возрастает, а использование лёгкой архитектуры на Flask и PostgreSQL упрощает развёртывание решения в корпоративных средах, включая контейнеризацию и интеграцию с существующими инструментами управления парком рабочих мест.
Заключение
Развитие импортозамещения и массовая миграция автоматизированных рабочих мест на отечественные операционные системы предъявляют повышенные требования к качеству и скорости инвентаризации ИТ‑инфраструктуры и подготовке управленческих решений. Показано, что традиционные системы мониторинга, ориентированные на непрерывный контроль и SLA‑аналитику, не всегда эффективны в сценариях разового сбора расширенных характеристик АРМ и их интеллектуальной обработки, что создаёт нишу для специализированных лёгких решений.
Разработанный прототип информационно‑аналитической системы реализует связку «разовый heartbeat‑сбор – ИИ‑кластеризация – управленческий отчёт» на базе веб‑приложения Flask, СУБД PostgreSQL и модулей анализа, использующих KMeans и крупную языковую модель для генерации рекомендаций. Архитектура, основанная на универсальной таблице Metric с JSONB‑полем, REST‑endpoint’ах /api/devicereport и /api/migration‑waves и веб‑страницах devicereport и migration_waves, обеспечивает гибкость, расширяемость и удобство интеграции прототипа в существующую инфраструктуру.
Практическая ценность решения заключается в снижении трудозатрат аналитиков при подготовке миграционных проектов, повышении обоснованности распределения рабочих мест по волнам и возможности применения прототипа как самостоятельного сервиса или модуля более крупной информационной системы импортозамещения. В дальнейшем развитие может быть связано с учётом дополнительных параметров (сетевые зависимости, критичность бизнес‑сервисов, графы связей между АРМ), внедрением более продвинутых методов кластеризации и переходом к использованию локально развёрнутых открытых LLM‑моделей в периметре корпоративной инфраструктуры.
Список литературы:
- Постановление Правительства РФ от 16.11.2015 № 1236 (ред. от 29.06.2023) «Об установлении запрета на допуск программного обеспечения, происходящего из иностранных государств, для целей осуществления закупок для обеспечения государственных и муниципальных нужд» [Электронный ресурс]. — URL: http://www.consultant.ru/document/cons_doc_LAW_189389/ (дата обращения: 12.02.2026).
- Zabbix Documentation [Электронный ресурс] // Zabbix LLC. — 2024. — URL: https://www.zabbix.com/documentation/current/en/manual (дата обращения: 12.02.2026).
- Prometheus Documentation [Электронный ресурс] // The Linux Foundation. — 2024. — URL: https://prometheus.io/docs/introduction/overview/ (дата обращения: 12.02.2026).
- Педамкар П. Основы машинного обучения с использованием Python и библиотеки Scikit-Learn / П. Педамкар, Дж. Фаулер; пер. с англ. А.А. Слинкина. — М.: ДМК Пресс, 2020. — 258 с.
- Маккинни У. Python и анализ данных / У. Маккинни; пер. с англ. А.А. Слинкина. — М.: ДМК Пресс, 2020. — 540 с.

