Поздравляем с Днем студента!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 16(60)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3

Библиографическое описание:
Белов Н.И. АЛГОРИТМ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ АВТОМОБИЛЬНЫХ НОМЕРОВ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ СВЕРТОЧНЫХ СЕТЕЙ // Студенческий: электрон. научн. журн. 2019. № 16(60). URL: https://sibac.info/journal/student/60/139021 (дата обращения: 24.01.2025).

АЛГОРИТМ АВТОМАТИЧЕСКОГО РАСПОЗНАВАНИЯ АВТОМОБИЛЬНЫХ НОМЕРОВ НА ОСНОВЕ ИСПОЛЬЗОВАНИЯ СВЕРТОЧНЫХ СЕТЕЙ

Белов Никита Игоревич

магистрант, факультет безопасности информационных технологий,

РФ, г. Санкт-Петербург

В настоящее время системы автоматического распознавания автомобильных номеров используются в совершенно разных областях. Например, такие системы используются в системах СКУД, автомобильных парковках, контроль ПДД на опасных участках трассы и т.д. Таким образом возможность распознавания автомобильного номера в автоматическом порядке позволяет добиться высокой скорости реакции на возможные неправомерные действия со стороны водителя автомобиля и снизить фактор человеческой ошибки.

Под системой автоматизации распознавания автомобильных номеров подразумевается программный комплекс, реализующий алгоритмы оптического распознавания символов с изображения, где расположен государственный регистрационный знак автомобиля.

В основе большинства алгоритмов распознавания автомобильных номеров лежат следующие процедуры [3]:

  1. локализация;
  2. нормализация;
  3. сегментация;
  4. распознавание;
  5. синтаксический анализ.

Основная задача первой процедуры является детектирование и локализация на изображении включающей государственный регистрационный знак.

Нормализация заключается в преобразование полученного изображения на прошлом шаге к необходимому виду, по средству геометрических преобразований, изменению яркости изображения, удалению шумов, бинаризации.

Задача сегментации заключается в выделении с нормализованного изображения отдельных символов. Для этого, как правило, используют такие операции как оператор Собеля, детектор контуров и т.д. [3].

Задачей распознавания является формирование строки символов из локализованных областей, включающих номера, например, алгоритм сопоставления изображений и шаблонов, используя статистические характеристики, интегральные преобразования.

Последним этапом является синтаксический анализ полученного текста, его основная цель заключается в определении элементов строки, представляющей символы номера. Данные элементы могут иметь различия согласно государственным стандартам стран, где происходит регистрация номера и получение номерного знака. В Российской Федерации таким стандартов является ГОСТ Р 50577-93.

Согласно данному стандарту, автомобильный номер может содержать буквы кириллического алфавита («А», «В», «Е», «К», «М», «Н», «О», «Р», «Т», «У», «Х»), цифры (0-9). И состоит из номера и региона. Номер представляет собой статичный набор, где первым элементам всегда является буква, три последующих – цифрами, два последних – буквами, регион в свою очередь состоит из двух или трех цифр.

С активным этапом развития нейронных сетей, данная структура сократилась до двух этапов - локализации и распознавания. Так как в данной сфере начали использовать искусственные нейронные сети взамен статистических методов распознавания.

В связи с этим, был разработан метод базирующийся на сверточных нейронных сетях. Алгоритм представляет собой программный код, реализованный на языке программировании Python 3. Первой его частью является реализация алгоритма скользящего окна [1]. Суть данного метода состоит в следующем, из исходного изображения вырезается окно размером 128 х 64 px с шагом 30 px для вертикальной и горизонтальной оси таким образом мы получаем большое количество изображений из исходного [4]. Пример представлен на Рисунке 1.

 

Рисунок 1. Пример результата работы алгоритма скользящего окна

 

Далее, после сбора всех полученных на предыдущем этапе частей изображения на вход нейронной сети подается изображение пакетным методом. На выходе данная архитектура имеет 10 выходных слоев, 9 из которых хранят информацию о классе буквы, стоящей на этой позиции в автомобильном номере. Первый же выходной слой является индикатором присутствия на данном изображении номера имеющий значение от 0 до 1. Сделано это для оптимизации временных затрат на обработку фотографий данным алгоритмом. На Рисунке 2 представлена архитектура сверточной нейронной сети использовавшаяся для данной задачи [2].

 

Рисунок 2. Архитектура алгоритма

 

Обучение данной архитектуры происходило в течение 6 часов на аннотированной обучающей выборке, включающей 80 000 примеров и контрпримеров, тестировании производилось на 20 000 изображений.

В ходе работы были получены следующие результаты:

  • Точность локализации номера при использовании такого алгоритма составила 97,7% на обучающей и 99,3% на тестовой выборке;
  • Время, затраченное на одно изображение, составляет 15,118 мс;
  • Точность распознавания номера составила 87,1% на обучающей и 83,7% на тестовой выборке.

Также в ходе работы были сделаны выводы и замечания по улучшению данной технологии. Для улучшения показателя точности необходимо увеличить объем выборок, и на стадии обучения обучать более 100 эпох.

 

Список литературы:

  1. Victor Hugo Cunha de Melo, Samir Leao, David Menotti, William Robson Schwartz. An Optimized Sliding Window Approach to Pedestrian Detection [Электронный ресурс]. — Режим доступа. — URL: http://www.ssig.dcc.ufmg.br/wp-content/uploads/2014/09/2014-An-Optimized-Sliding-Window-Approach-to-Pedestrian-Detection.pdf (дата обращения: 22.04.2019)
  2. Fabian Stark, Caner Hazırba¸s, Rudolph Triebel, and Daniel Cremers. CAPTCHA Recognition with Active Deep Learning [Электронный ресурс]. — Режим доступа. — URL: https://vision.in.tum.de/_media/spezial/bib/stark-gcpr15.pdf (дата обращения: 23.04.2019)
  3. Shin Shi. Emgu CV Essentials. Packt Publishing, 2013, 105 p.
  4. Tianyi Liu, Shuangsang Fang, Yuehui Zhao, Peng Wang, Jun Zhang. Implementation of Training Convolutional Neural Networks [Электронный ресурс]. — Режим доступа. — URL: https://arxiv.org/ftp/arxiv/papers/1506/1506.01195.pdf (дата обращения: 22.04.2019)

Оставить комментарий