Телефон: 8-800-350-22-65
Напишите нам:
WhatsApp:
Telegram:
MAX:
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 1(339)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7, скачать журнал часть 8, скачать журнал часть 9

Библиографическое описание:
Метелкин П.А. ОПТИМИЗИРОВАННЫЙ ПАЙПЛАЙН КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ ДЕТЕКЦИИ КОНТЕКСТУАЛЬНЫХ АНОМАЛИЙ БЕЗОПАСНОСТИ В УСЛОВИЯХ ОГРАНИЧЕННЫХ РЕСУРСОВ // Студенческий: электрон. научн. журн. 2026. № 1(339). URL: https://sibac.info/journal/student/339/399582 (дата обращения: 28.01.2026).

ОПТИМИЗИРОВАННЫЙ ПАЙПЛАЙН КОМПЬЮТЕРНОГО ЗРЕНИЯ ДЛЯ ДЕТЕКЦИИ КОНТЕКСТУАЛЬНЫХ АНОМАЛИЙ БЕЗОПАСНОСТИ В УСЛОВИЯХ ОГРАНИЧЕННЫХ РЕСУРСОВ

Метелкин Павел Александрович

студент, кафедра информационная безопасность, Херсонский технический университет,

РФ, г. Геническ

OPTIMIZED COMPUTER VISION PIPELINE FOR DETECTION OF CONTEXTUAL SECURITY ANOMALIES UNDER LIMITED RESOURCES

 

Metelkin Pavel Aleksandrovich

Student, Department of Information Security, Kherson Technical University,

Russia, Genichesk

 

АННОТАЦИЯ

Статья посвящена разработке высокоэффективного пайплайна компьютерного зрения для детекции инсайдерских угроз на рабочих местах. Основной вызов заключается в необходимости выполнения ресурсоемкого анализа видеопотока в реальном времени на клиентских устройствах с ограниченными вычислительными возможностями. Предложенное решение основано на интеграции оптимизированных моделей YOLO для детекции объектов и анализа позы, а также сети для верификации лиц. Ключевым вкладом является методология агрессивного 8-битного квантования (INT8) обученных моделей, позволившая сократить их объем на 75% при потере точности менее 2%. Эксперименты подтверждают высокую эффективность пайплайна: средняя точность детекции устройств составила 94.2%, а время обработки кадра на GPU — 125 мс. Результаты демонстрируют практическую возможность создания интеллектуальных систем мониторинга, работающих непосредственно на периферийных устройствах.

ABSTRACT

The article is devoted to the development of a highly efficient computer vision pipeline for detecting insider threats in the workplace. The main challenge is the need to perform resource-intensive real-time video stream analysis on client devices with limited computational capabilities. The proposed solution is based on the integration of optimized YOLO models for object detection and pose analysis, as well as a network for face verification. The key contribution is the methodology of aggressive 8-bit quantization (INT8) of trained models, which allowed to reduce their size by 75% with a loss of accuracy of less than 2%. Experiments confirm the high efficiency of the pipeline: the average accuracy of device detection was 94.2%, and the frame processing time on the GPU was 125 ms. The results demonstrate the practical possibility of creating intelligent monitoring systems that operate directly on peripheral devices.

 

Ключевые слова: компьютерное зрение, детекция аномалий, edge computing, квантование моделей, YOLO, инсайдерские угрозы.

Keywords: computer vision, anomaly detection, edge computing, model quantization, YOLO, insider threats.

 

Распространение удаленных форматов работы обострило проблему визуальных инсайдерских угроз, таких как несанкционированная съемка экрана. Традиционные средства безопасности неспособны противодействовать подобным рискам, в то время как развертывание систем компьютерного зрения на рабочих станциях пользователей упирается в ограниченность вычислительных ресурсов. Целью работы является создание оптимизированного многозадачного пайплайна, способного в реальном времени детектировать контекстуальные аномалии (устройства съемки, посторонних лиц, изменение активности пользователя) в условиях жестких ограничений по производительности и энергопотреблению.

Архитектура пайплайна объединяет три ключевые задачи в единый конвейер обработки. Для детекции мобильных телефонов и камер применяется легковесная версия модели YOLOv8 (nano или small), дообученная на синтезированном датасете с применением агрессивной аугментации, включая метод CutMix для повышения робастности. Верификация лиц реализована по двухэтапной схеме: детекция всех лиц в кадре и последующее сравнение их векторных представлений (эмбеддингов) с эталоном пользователя с помощью метрической сети, обученной с функцией потерь ArcFace. Для классификации активности пользователя (активен/отсутствует/пассивен) используется модель YOLOv8-Pose, определяющая ключевые точки скелета, на основе которых вычисляются угловые и позиционные признаки, анализируемые простой рекуррентной сетью (GRU).

Критическим этапом, обеспечивающим работоспособность на edge-устройствах, стало послетренировочное 8-битное целочисленное квантование (PTQ). После обучения модели в формате FP32 она экспортировалась в ONNX и подвергалась калибровке на репрезентативном наборе данных для определения оптимальных параметров масштабирования. Преобразование весов и активаций в INT8 формат позволило радикально снизить требования к памяти и ускорить вычисления за счет использования целочисленных операций процессора.

Эксперименты проводились на тестовом стенде (CPU Intel Core i7, GPU NVIDIA GTX 1060) с использованием синтезированного датасета. После применения INT8-квантования размер моделей сократился на 76%. Падение точности оказалось минимальным: для детекции устройств средняя точность (mAP@0.5) составила 94.2% (потеря 1.8 п.п. по сравнению с FP32), точность верификации лиц — 98.7%, классификации активности — 89.1%.

Производительность пайплайна достигла целевых показателей: время обработки кадра на CPU составило ~210 мс (~4.7 FPS), а при использовании GPU ускорилось до 125 мс (~8 FPS), что соответствует требованиям к системам, работающим в режиме, близком к реальному времени. Потребление оперативной памяти не превышало 850 МБ.

Работа подтверждает возможность создания комплексного пайплайна компьютерного зрения для безопасности, пригодного для развертывания на клиентских рабочих станциях. Системное применение методологии квантования позволило разрешить противоречие между высокими требованиями к точности детекции контекстуальных аномалий и жесткими ограничениями периферийных устройств. Достигнутый баланс открывает путь к разработке этичных систем мониторинга, где вся обработка конфиденциальных визуальных данных, включая обезличивание, выполняется локально, что обеспечивает как безопасность, так и соблюдение приватности.

 

Список литературы:

  1. Ultralytics. YOLO11: Оценка позы. Документация электронный ресурс] — Режим доступа. — URL: https://docs.ultralytics.com/ru/tasks/pose/
  2. Liu Y., Zhang H., Wang J. et al. HP-YOLO: A Lightweight Real-Time Human Pose Estimation Method // Applied Sciences. 2025. Vol. 15, no. 6. P. 3025.
  3. Li C., Wang S., Yang X. et al. SAL-YOLO-DeepSeek: a lightweight real-time detection model for escalator passenger safety // Scientific Reports. 2025. Vol. 15. Article 24260.

Оставить комментарий