Телефон: +7 (383)-202-16-86

Статья опубликована в рамках: XXXI Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 28 апреля 2015 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Барсуков А.А., Минаев А.С., Шипилов С.С. ПРИМЕНЕНИЕ АЛГОРИТМА K-MEANS, НЕЙРОННОЙ СЕТИ ХЭММИНГА И МЕТОДА ВИОЛЫ-ДЖОНСА ДЛЯ РАСПОЗНАВАНИЯ ТЕКСТА // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. XXXI междунар. студ. науч.-практ. конф. № 4(30). URL: http://sibac.info/archive/technic/4(30).pdf (дата обращения: 22.08.2019)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

ПРИМЕНЕНИЕ  АЛГОРИТМА  K-MEANS,  НЕЙРОННОЙ  СЕТИ  ХЭММИНГА  И  МЕТОДА  ВИОЛЫ-ДЖОНСА  ДЛЯ  РАСПОЗНАВАНИЯ  ТЕКСТА

Барсуков  Андрей  Алексеевич

Минаев  Александр  Сергеевич

Шипилов  Сергей  Сергеевич

студенты  4  курса,  кафедра  «Прикладная  математика  и  информатика»,  РФ,  г.  Тольятти

Е-mail barsukov2@gmail.com

Климов  Виталий  Сергеевич

научный  руководитель,  канд.  тех.  наук,  доцент,  РФ,  г.  Тольятти

 

Для  контроля  автомобильных  потоков  в  коммерческих  или  правоохранительных  целях  часто  требуется  проводить  распознавание  автомобильных  номеров  движущихся  объектов.

Решение  данной  задачи  можно  разделить  на  3  этапа:  выделение  движущихся  объектов;  локализация  на  выделенных  объектах  номерных  знаков;  распознавание  текста  номерного  знака  [2;  3;  5]. 

Для  каждого  из  данных  этапов  могут  применяться  различные  алгоритмы  искусственного  интеллекта,  нами  же  исследуется  совместная  работа  алгоритмов,  представленная  в  таблице  1.

Таблица  1.

Предложенные  сочетания  алгоритмов  для  организации  системы  распознавания  автомобильных  номеров

Этап

Алгоритм

Параметры  работы  алгоритма

1.  Выделение  движущихся  объектов

k-means

Количество  кластеров  —  в  зависимости  от  количества  одновременно  анализируемых  объектов.  Выбор  метрики  не  оказывает  значительного  влияния  на  работу.

2.  Локализация  номерных  знаков

Метод  Виолы-Джонса

Входные  данные  для  обучения  —  общедоступная  база  данных  изображений  номерных  знаков.

3.  Распознавание  текста  номерного  знака

Нейронная  сеть  Хэмминга

Входные  данные  для  обучения  —  по  одному  изображению  для  каждого  символа  применяемого  в  обозначении  номерных  знаков.  Рекомендуемый  размер  матрицы  входных  нейронов  —  10x20. 

 

Алгоритм  работы  системы  распознавания  номерных  знаков:

1.  Сравнение  двух  кадров  сделанных  с  небольшим  интервалом  времени  с  одной  и  той  же  точки  для  поиска  в  двухмерном  пространстве  координат  пикселей  изменивших  свое  значение.

2.  Запуск  алгоритма:  кластеризация  k-means  где  входными  данными  являются  координаты  пикселей,  найденные  на  предыдущем  шаге.  Количество  кластеров  выбирается  равным  из  диапазона  5·NNгде  N  —  максимальное  количество  предполагаемых  для  наблюдения  объектов.

3.  Центры  кластеров  расположенные  рядом  друг  с  другом  группируются,  т.  к.  вероятней  всего  они  относятся  к  одному  объекту.  Границами  наблюдаемого  объекта  являются  крайние  координаты  точек,  найденные  в  шаге  1  и  относящиеся  (по  результатам  работы  алгоритма  k-means)  к  кластерам  из  данной  группы  (Рис.  1)

 

Рисунок  1.  Результат  выделения  движущегося  объекта  с  помощью  алгоритма  k -means.  Крестами  показаны  центры  кластеров.  Рамкой  показано  объединение  ближайших  кластеров

 

4.  Далее  возможно  распараллеливание  вычисления  для  каждого  найденного  объекта.

5.  С  помощью  метода  Виолы-Джонса  и  общедоступной  базы  изображений  номерных  знаков  проводится  выделение  у  каждого  объекта  области  соответствующей  образу  номерного  знака  (Рис.  2)  [4].

 

Рисунок  2.  Изображение,  выделенное  методом  Виолы-Джонса

 

6.  Затем  проводится  нормализация  изображения  путем  трансформации  до  фиксированных  размеров  (Рис.  3а).  Затем  приведение  изображения  в  двухцветный  вид  без  использования  градиентов  серого  (Рис.  3б).

 

Рисунок  3.  Преобразование  изображения  в  набор  биполярных  сигналов:  а  —  нормализация  изображения  путем  трансформации  до  фиксированных  размеров;  б  —  приведение  изображения  в  двухцветный  вид  без  использования  градиентов  серого

 

7.  Так  как  положение  символов  на  номерном  знаке  соответствуют  государственному  стандарту,  то  выделение  символов  из  полученного  изображения  проводится  путем  отсчета  от  левого  края  изображения  фиксированного  количества  пикселей  (Рис.  4)  [1].

 

Рисунок  4.  Выделение  символов  путем  отсчета  от  левого  края  изображения  фиксированного  количества  пикселей

 

8.  Полученные  изображения  трансформируются  в  набор  биполярных  сигналов,  понятных  для  нейронной  сети  Хэмминга.  Черный  пиксель  соответствует  сигналу  со  значением  “+1”,  белый  пиксель  сигналу  —  “-1”.

9.  Данный  набор  биполярных  сигналов  подается  на  вход  нейронной  сети  Хэмминга,  которая  определяет  каждый  символ  номерного  знака  по  отдельности.  Для  обучения  нейронной  сети  требуется  по  одному  изображению  для  каждого  символа  применяемого  в  обозначении  номерных  знаков.

 

Список  литературы:

1.ГОСТ  Р  50577-93.  Знаки  государственные  регистрационные  транспортных  средств.  Типы  и  основные  размеры.  Технические  требования.  Введ.  1993-29-06.  М.:  Изд-во  стандартов,  2002.  —  33  с.

2.Block  H.H.  Clustering  Methods:  A  History  of  k-Means  Algorithms  /  H.H.  Block  //  Selected  Contributions  in  Data  Analysis  and  Classification.  Springer  Berlin  Heidelberg,  2007.  —  рр.  161—172.

3.Mirkin  B.  Core  Concepts  in  Data  Analysis:  Summarization,  Correlation  and  Visualization  /  Boris  Mirkin.  Springer  London,  2011.  —  390  p.

4.Viola  P.  Rapid  Object  Detection  using  a  Boosted  Cascade  of  Simple  features  /  Paul  Viola,  Michael  Jones.  Accepted  Conference  on  Computer  Vision  and  Pattern  Recognition,  2001.  —  9  p.

5.Wu  J.  Advances  in  K-means  Clustering  :  A  Data  Mining  Thinking  /  Junjie  Wu.  Springer  Berlin  Heidelberg,  2012.  —  180  р. 

Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий