Статья опубликована в рамках: LVIII Международной научно-практической конференции «Экспериментальные и теоретические исследования в современной науке» (Россия, г. Новосибирск, 26 октября 2020 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Калита Д.И., Дубинович В.В. МОДЕЛИРОВАНИЕ КОНФИГУРАЦИЙ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ // Экспериментальные и теоретические исследования в современной науке: сб. ст. по матер. LVIII междунар. науч.-практ. конф. № 10(52). – Новосибирск: СибАК, 2020. – С. 5-11.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов

МОДЕЛИРОВАНИЕ КОНФИГУРАЦИЙ НЕЙРОННОЙ СЕТИ ДЛЯ РАСПОЗНАВАНИЯ ЦИФРОВЫХ ИЗОБРАЖЕНИЙ

Калита Диана Ивановна

канд. техн. наук, доц. кафедры физики и математики, Ставропольский государственный медицинский университет,

РФ, г. Ставрополь

Дубинович Владимир Викторович

магистрант кафедры информационных систем и технологий, Северо-Кавказский федеральный университет,

РФ. г. Ставрополь

SIMULATION OF NEURAL NETWORK CONFIGURATIONS FOR DIGITAL IMAGE RECOGNITION

Diana Kalita

Candidate of Science, assistant professor of Physics and Mathematics Department, Stavropol State Medical University,

Russia, Stavropol

Vladimir Dubinovich

Master's student of Information Systems and Technologies Department North Caucasus Federal University,

Russia, Stavropol

АННОТАЦИЯ

Статья посвящена проблемам разработки эффективных методов и алгоритмов распознавания цифровых изображений. Рассматривается вопрос влияния количества масок фильтров и слоев нейронной сети, на количество верно распознанных изображений. Для моделирования процесса распознавания изображений использовался математический пакет Matlab R2018a и база изображений цифр. Предложена конфигурация нейронной сети, дающая наилучшую обучающую выборку для распознавания образов на примере базы цифр.

ABSTRACT

The article is devoted to the problems of developing effective methods and algorithms for digital image recognition. The question of the influence of the number of filter masks and layers of the neural network on the number of correctly recognized images is considered. To simulate the image recognition process, we used the Matlab R2018a mathematical package and a database of images of numbers. A neural network configuration is proposed that gives the best training sample for pattern recognition using the example of a base of numbers.

Ключевые слова: Цифровая обработка сигналов, интеллектуальная система, нейронная сеть, распознавание образов, обработка изображений, цифровой фильтр, система остаточных классов.

Keywords: Digital signal processing, intelligent system, neural network, pattern recognition, image processing, digital filter, residual number system.

Введение

В настоящее время наблюдается возрастающий интерес к системам компьютерного зрения. Расширяется область прикладного применения таких систем для контроля и автоматизации различного рода деятельности, в частности, контроль движения в беспилотных автомобилях, контроль производственных процессов на заводах и фабриках, распознавание патологий на снимках МРТ или флюорографии, видеоаналитика для обеспечения безопасности и др. Соответственно, возникает востребованность в применении систем компьютерного зрения с самыми высокими характеристиками. Среди таких характеристик высокая точность распознавания объекта и высокая скорость обработки полученной информации. В свою очередь, обработка и интерпретация цифровых данных в виде потока цифровых изображений также требует особого подхода. Таким образом, одной из центральных проблем в области разработки систем компьютерного зрения является разработка эффективных методов и алгоритмов распознавания цифровых изображений.

Одним из перспективных методов для решения обозначенного круга задач является искусственный интеллект. Существующие методы, модели и алгоритмы, применяющиеся для решения указанного класса задач, имеют противоречие между вычислительной сложностью и аппаратной реализацией, заключающееся в требованиях высокой производительности, отказоустойчивости, а также точной вычислительной обработки данных.

Большое количество публикаций отечественных и зарубежных исследователей за последнее время в качестве основной вычислительной структуры предлагают использовать конечные алгебраические структуры. Конечные алгебраические структуры применяют для замены позиционной системы счисления, в ряде приложений, в том числе и в цифровой обработке изображений [1,2,3,4]. В работах [9,10] авторы развивают идею о совместном использовании искусственных нейронных сетей и арифметики вычетов (системы остаточных классов), которая является прямой суммой конечных колец. Эффективность в применении такой арифметики достигается за счет эффективного использования параллелизма и снижения разрядности операндов [3,5,6,10]. Кроме того, важным свойством системы остаточных классов является высокая отказоустойчивая реализация вычислений при небольшой избыточности системы, что позволяет разрабатывать нейросетевую модель с высокой степенью надежности и определению и коррекции ошибок [7]. Следует отметить и целесообразность применения системы остаточных классов при решении задач цифровой обработки изображений, что подтверждается в работах [3,8,9], где применение арифметики вычетов при построении КИХ-фильтров дает существенное повышение скорости вычислений по сравнению с позиционной системой счисления.

Моделирование процесса распознавания изображения

Задача распознавания в цифровой обработки изображений сводится к принятию решения относительно полученного изображения, т.е. его классификации. Под классификацией понимается процесс назначения определенного признака (метки) класса объектам, согласно некоторому описанию свойств этих объектов [7]. Таким образом, распознавание образов можно определить, как отнесение исходных данных к определенному классу с помощью выделения существенных признаков или свойств, характеризующие эти данные из общей массы несущественных деталей. Отдельный класс методов распознавания. Отличительной особенностью от других методов является способность обучаться. Метод распознавания на основе нейронных сетей требует либо большого количества примеров задачи распознавания при обучении, либо специальной структуры нейронной сети, учитывающей специфику данной задачи. Тем не менее, по сравнению с другими методами, его отличает более высокая эффективность и производительность.

Поставим задачу, в ходе решения которой создадим сверточную нейронную сеть, распознающую 10 образов на примере базы цифр. На рисунке 1 представлены классы изображений, всего для обучения используются 1000 изображения, принадлежащие разным классам. Пример набора изображений одного класса изображен на рисунке 2.

В качестве примера рассмотрим архитектуру сверточной нейронной сети, в которой, на вход подается изображение размера пикселей. Сеть будет состоять из входного слоя, сверточного слоя, слоя нормализации значений, слоя с нелинейной функцией активации, слоя выбора максимального значения сверточного слоя и полносвязанного слоя нейронной сети.

Рисунок 1. Классы изображений

Рисунок 2. Пример изображений одного класса

Для оценки точности распознавания работы сверточной нейронной сети проведем моделирование процесса с различными конфигурациями сети. В качестве варьируемых параметров будем использовать разное количество фильтров и слоев сети. Моделирование производилось в математическом пакете Matlab R2018a. На рисунке 2.7 приведены графики обучения для трех конфигураций сети с различным числом сверточных слоев и слоев выбора максимального элемента, а также с различным числом цифровых фильтров на них. Из графиков видно, что наилучшую обучающую выборку дает вторая конфигурация сети с четырьмя сверточными слоями и тремя слоями выбора максимального значения элемента. В таблице 1 приведены результаты точности распознавания для различных конфигураций сверточной нейронной сети.

а)

б)

в)

Рисунок 3. Обучающие последовательности

Таблица 1.

Конфигурации сети

Конфигурация сети 1
Слои сети	Число слоев сети	Число фильтров на слоях	Точность распознавания
Сверточный слой	3	8 16 32	98,84%
Выбор максимального значения	2
Конфигурация сети 2
Сверточный слой	4	12 16 32 64	99,60%
Выбор максимального значения	3
Конфигурация сети 3
Сверточный слой	3	12 16 32	99,12%
Выбор максимального значения	2

Таким образом, результаты моделирования показали, что при увеличении количества масок фильтров и слоев сети, количество верно распознанных изображений увеличивается. Наилучший результат распознавания дает 2 конфигурация сети. Моделирование процесса работы нейронной сети позволило выбрать конфигурацию сети, дающую наилучший результат распознавания.

Список литературы:

Балухто, А.Н. Нейросетевая фильтрация и сегментация цифровых изображений / А. Н. Балухто, Л. Е. Назаров // Нейрокомпьютеры в прикладных задачах обработки изображений. – 2007. – № 25. – С. 7-24.
Галушкин, А.И. Нейрокомпьютеры для обработки изображений / А.И. Галушкин, Н.С. Томашевич, Е.И. Рябцев // Нейрокомпьютеры в прикладных задачах обработки изображений. – 2007. – № 25. – С. 74-109.
Червяков, Н.И. О выборе диапазона системы остаточных классов для цифровой обработки изображений / Н.И. Червяков, П.А. Ляхов, Д.И. Калита // Инфокоммуникационные технологии. – 2016. – Т. 14. – №2. – С. 111-122.
Червяков, Н.И. Выбор оптимального набора модулей системы остаточных классов для повышения производительности фильтров с конечной импульсной характеристикой / Н.И. Червяков, П.А. Ляхов, Д.И. Калита // Информационные технологии. – 2015. – Т.21. – №12. – С.923-929.
Червяков, Н.И. Методы, алгоритмы и техническая реализация основных проблемных операций, выполняемых в системе остаточных классов / Н.И. Червяков // Инфокоммуникационные технологии. – 2011. – №4. – С. 4-12.
Червяков, Н.И. Архитектура сверточной нейронной сети с вычислениями в системе остаточных классов с модулями специального вида / Н.И. Червяков, П.А. Ляхов, Д.И. Калита, М.В. Валуева // Нейрокомпьютеры: разработка, применение. – 2017. – №1. – С. 3-15.
Хайкин, С. Нейронные сети: полный курс, 2-е издание / С. Хайкин. – М.: Вильямс, 2006. – 1104 с.
Chervyakov, N.I. Effect of RNS dynamic range on grayscale image filtering / N.I. Chervyakov, P.A. Lyakhov, D.I. Kalita, K.S. Shulzhenko // 2016 XV International Symposium Problems of Redundancy in Information and Control Systems (REDUNDANCY). – St. Petersburg, 2016. – P. 33 – 37.
Khan, H. Efficient eyes and mouth detection algorithm using combination of viola jones and skin color pixel detection / H. Khan, M. Abdulla, Bin Zainal Shamian // International Journal of Engineering and Applied Sciences. – 2013. – №4. – Vol. 3. – P. 234 – 245.
Nakahara, H. A deep convolutional neural network based on nested residue number system / H. Nakahara, T. Sasao / 25th International Conference on Field Programmable Logic and Applications (FPL). – London, 2015. – P. 1 – 6.

Проголосовать за статью

Дипломы участников

У данной статьи нет
дипломов