Статья опубликована в рамках: Научного журнала «Студенческий» № 24(152)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
ПРОЕКТИРОВАНИЕ СИСТЕМЫ УПРАВЛЕНИЯ ПРОИЗВОДСТВЕННЫМ ПРОЦЕССОМ С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ МАШИННОГО ЗРЕНИЯ
DESIGN OF A PRODUCTION PROCESS CONTROL SYSTEM USING MACHINE VISION TECHNOLOGIES
Vladislav Putnikov
Master degree student, Department of Computer Intelligent Design Technologies, Voronezh state technical university
Russia, Voronezh
Valery Vetokhin
Scientific director, assistant professor Voronezh state technical university
Russia, Voronezh
АННОТАЦИЯ
Распознавание дефектных деталей является одной из актуальной исследовательской проблемой обработки изображений, машинного обучения и компьютерного зрения, в связи с огромным увеличением объема данных, полученных с использованием научных и промышленных инструментов. Разработанный алгоритм классификации дефектных изображений на примере деревянных структур может быть использован в системах управления производством в целях повышения качества конечной продукции и автоматизации процессов.
ABSTRACT
Recognition of defective parts is one of the topical research problems in image processing, machine learning and computer vision, due to the huge increase in the amount of data obtained using scientific and industrial tools. The developed algorithm for the classification of defective images on the example of wooden structures can be used in production control systems in order to improve the quality of the final product and automate processes.
Ключевые слова: сверточные нейронные сети, машинное зрение, алгоритм, бинарная классификация, распознавание образов, обработка изображений.
Keywords: convolutional neural networks, machine vision, algorithm, binary classification, pattern recognition, image processing.
В качестве объекта исследования был выбран набор изображений деревянных структур, который включал в себя изображения структур с дефектами и без. Дефектные объекты содержали 4 возможных аномалии: трещину, пятно, пористость и узел. Эти четыре были объединены в единый ярлык, а именно аномальный. Таким образом, задача распознавания дефектных деталей сводится к задаче бинарной классификации, где каждому изображению детали в зависимости от ее качества ставится метка класса. Если деталь без дефектов ей ставится метка 1, в противном случае 0.
Набор данных был разделен на 2 раздела: обучающий (train) и тестовый (test), которые в свою очередь составляли 70% и 30% от всего набора данных. На рисунках 1 и 2 приведены примеры исходных изображений.
Рисунок 1. Примеры изображений деревянных структур без дефектов
Рисунок 2. Примеры изображений аномальных деревянных структур
Диапазон размеров изображений составил 210х210 – 610х700. Поэтому в первую очередь все изображения требовалось привести к общему размеру, к минимальному - 210х210. Для улучшения результата глубокой нейронной сети, содержащей большое число слоев, часто применяются разные трансформации изображений, такие как: поворот, сдвиги, повышение яркости, переворот и т.д. После чего изображения подаются на вход нейронной сети. Такие трансформации генерируются случайно для каждого изображения, это делается с целью повышения устойчивости модели к искажениям [1]. После этого изображения подаются на вход нейронной сети. На рисунке 3 приведены примеры изображений сдвинутых, масштабированных, повернутых, наклоненных деталей.
Рисунок 3. Пример трансформированных изображений
Для эффективного обучения нейронных сетей практически всегда рекомендуется выполнять некоторое масштабирование входных значений, в нашем случае значений пикселей. Нормализация данных приводит все значения яркости входного тензора к диапазону от 0 до 1, если разделить каждое значение на 255.
Архитектура глубоких нейронных сетей может сильно различаться по структуре в зависимости от назначения сети, но все они имеют некоторые базовые компоненты. На основании приведённого исследования за основу разработки нейронных сетей была взята архитектура LeNet, с последовательным наращиванием слоев и применением различных эвристических процедур и подходов для улучшения результатов распознавания [2-3]. После серии экспериментальных исследований была получена спроектирована следующая нейронная сеть:
- Входной слой.
- Сверточный слой с 32 картами признаков и размером ядра фильтра 3 × 3.
- Слой дискредитирующий (максимум в окрестности 2 ×2).
- Сверточный слой с 64 картами признаков и размером ядра фильтра 3 × 3.
- Слой дискредитирующий (максиму в окрестности 2 ×2).
- Слой Dropout-регуляризации с вероятностью 50%.
- Слой преобразования размерности данных.
- Полносвязный слой и функцией активации relu.
- Выходной полносвязный слой с функцией активации softmax.
Список литературы:
- Алпатов Б.А., Обработка изображений и управление в системах автоматического сопровождения объектов: учеб. пособие / Б.А.Алпатов, П.В. Бабаян, О.Е. Балашов, А.И. Степашкин // Рязан. гос. радиотехн ун-т Рязань, 2011. 236 с.
- Memisevic R. Learning to represent spatial transformations with factored higher-order Boltzmann machines / R. Memisevic, G. E. Hinton // Neural Computation 22 (6) (2010) 1473–1492.
- Xie G. Integrating supervised subspace criteria with restricted Boltzmann machine for feature extraction / G. Xie, X. Zhang, Y. Zhang, C. Liu // International Joint Conference on Neural Networks (IJCNN) 2014 pp. 1622–1629.
Оставить комментарий