Статья опубликована в рамках: III-IV Международной научно-практической конференции «Вопросы технических и физико-математических наук в свете современных исследований» (Россия, г. Новосибирск, 27 июня 2018 г.)

Наука: Информационные технологии

Секция: Теоретические основы информатики

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Дмитриева В.А. ОБЗОР И СРАВНЕНИЕ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИЦ БИБЛИОТЕКИ OPENCV // Вопросы технических и физико-математических наук в свете современных исследований: сб. ст. по матер. III-IV междунар. науч.-практ. конф. № 3-4(3). – Новосибирск: СибАК, 2018. – С. 29-32.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

ОБЗОР И СРАВНЕНИЕ АЛГОРИТМОВ РАСПОЗНАВАНИЯ ЛИЦ БИБЛИОТЕКИ OPENCV

Дмитриева Валерия Александровна

магистрант кафедры информационные системы и технологии, Донской государственный технический университет,

РФ, г. Ростов-на-Дону

АННОТАЦИЯ

В статье рассматриваются и сравниваются различные алгоритмы открытой кроссплатформенной библиотеки OpenCV, которая позволяет создавать и совершенствовать компьютерное зрение для систем распознавания лиц. Для получения наилучших результатов в задачах распознавания лиц рекомендуется использовать комбинацию из пере­численных алгоритмов, поскольку так можно получить наиболее полную информацию из датасета в обучающей выборке.

ABSTRACT

The article discusses and compares the various algorithms of the open cross-platform OpenCV library, which allows creating and improving computer vision for face recognition systems. For best results in face recognition problems, it is recommended to use a combination of the algorithms, this is how you can get the most complete information from the dataset in the training sample.

 

Ключевые слова: алгоритм распознавания лиц, OpenCV, метод главных компонент, линейный дискриминантный анализ, гистограммы локальных бинарных шаблонов.

Keywords: face recognition algorithm, OpenCV, Eigenfaces, Fisherfaces, Local Binary Patterns Histograms.

 

В 2017 году Правительством Российской Федерации была разрабо­тана программа перехода экономики страны к цифровой. Создание информационной инфраструктуры и обеспечение информационной безопасности обеспечивается в том числе за счет открытости и прозрач­ности действий граждан, поэтому системы распознавания лиц являются неотъемлемой частью цифрового будущего. Задача распознавания лиц в последние годы было активной областью исследований, при этом основное внимание уделялось автоматическому обнаружению и сопоставлению лиц в неподвижных изображениях и потоковых видео для аутентификации и идентификации. Популярной библиотекой для решения таких задач является OpenCV. Таким образом, тема статьи, посвященная алгоритмам библиотеки OpenCV, позволяющая создавать и совершенствовать компьютерное зрение для систем распознавания лиц с целью обеспечения безопасности на предприятиях, в общественных местах или спальных микрорайонах, а также с целью таргетинга в ритейле, банковской сфере и медицинской сфере является актуальной.

Данная статья ставит перед собой задачу обзора и сравнения алго­ритмов библиотеки OpenCV. OpenCV (Open Source Computer Vision) - это кроссплатформенная библиотека компьютерного зрения, целью которой является обработка изображений в режиме реального времени. OpenCV содержит три алгоритма распознавания лиц: Eigenfaces, Fisherfaces и Local Binary Patterns Histograms, в каждом из которых в основе лежат свои методы: метод главных компонент, линейный дискри­минантный анализ и гистограммы локальных бинарных шаблонов соответственно.

Алгоритм Eigenfaces сначала проецирует все обучающие примеры в подпространство анализа главных компонент, затем проецирует заданное фото в это подпространство, а потом происходит поиск ближайших схожих признаков между тренировочными примерами и заданным фото. Использование всего набора численных признаков в процессе распознавания лиц может существенно замедлить работу алгоритма и снизить точность получаемого решения. Поэтому важным для снижения размерности в процессе решения задачи распознавания является извлечение наиболее информативных признаков. Метод главных компонент позволяет уменьшить число переменных за счет выбора самых изменчивых из них. Метод главных компонент хорошо зареко­мендовал себя в практических приложениях. Однако, в тех случаях, когда на изображении лица присутствуют значительные изменения в освещенности или выражении лица, эффективность метода значительно падает. Все дело в том, что метод главных компонент выбирает под­пространство с такой целью, чтобы максимально аппроксимировать входной набор данных, а не выполнить дискриминацию между классами лиц.

В основе алгоритма Fisherfaces лежит линейный дискриминантный анализ, который ищет проекцию данных, при которой классы максимально линейно отделимы. Метод главных компонент, в отличие от линейного дискриминантного анализа, ищет проекцию данных, при которой будет максимизирован разброс по всей базе данных лиц (без учета классов). Иными словами метод главных компонент уменьшает размерность, сохраняя при этом как можно большую часть дисперсии в высоком размерном пространстве. Линейный дискрими­нантный анализ уменьшает размерность, сохраняя при этом как можно больше дискриминационной информации о классе. Экспериментально доказано [1], что в условиях сильного нижнего и бокового затемнения фото алгоритм Fisherface показал 95 % эффективность (по сравнению с 53 % Eigenface).

Fisherfaces работает достаточно хорошо при одинаковом уровне освещенности изображения.

Но в реальной жизни нельзя гарантировать всегда идеальные параметры размера, освещения, поворота лица на изображениях. Согласно официальной документации OpenCV [6], для получения хоро­шего показателя распознавания требуется приблизительно 8 изображений на каждого человека, что создает трудности при формировании датасета. Решение казалось не оптимизированным в должной мере, поэтому цель была вместо представления изображений в виде многомерного вектора - извлечь локальные признаки. Алгоритм Local Binary Patterns Histograms (LBPH) предполагает суммирование локальных структур изображения путем сравнения каждого пикселя со смежными. Изображение разбивается на n локальных областей, в каждой из которых выделяется центральный пиксель и сравнивается со смежными. Если интенсивность смежного пикселя больше или равна интенсивности центрального, то смежный пиксель обозначается 1, в противном случае ставится 0. Итоговое бинарное число является локальным бинарным шаблоном. После извлечения из каждой локальной области гистограмм локальных бинарных шаблонов происходит их соединение в итоговую модель распознавания лиц. Алгоритм LBPH не чувствителен к монотон­ным трансформациям в оттенках серого.

Подводя итоги, можно сделать следующие выводы: Fisherface эффективнее Eigenface, однако и первый и второй алгоритм чувстви­тельны к внешним факторам, таким как различия освещенности, точка обзора камеры и геометрия сцены. Local Binary Patterns Histograms показывает в этом случае лучшие результаты, поскольку устойчив к изменениям в освещении. Для достижения наилучшего результата в задачах распознавания лиц рекомендуется использовать комбинацию из перечисленных алгоритмов на разных этапах распознавания. Так можно получить наиболее полную информацию из датасета в обучающей выборке. Библиотеку OpenCV рекомендуется применять в сочетании с фреймворком TensorFlow, чтобы добиться эффективности при обучении машины.

 

Список литературы:

  1. Peter N. Belhumeur, Joao P. Hespanha, David J. Kriegman Eigenfaces vs. Fisherfaces: Recognition Using Class Specific Linear Projection // IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE. - 1997. - №7. - С. 711-720.
  2. Волынец М.Ю., Майков К.А. Комбинированный метод обнаружения и распознавания лиц в реальном режиме // Новые информационные технологии в автоматизированных системах. - 2014. - № 17. - С. 161-167.
  3. Мищенкова Е.С. Сравнительный анализ алгоритмов распознавания лиц // Вестник ВолГУ. Серия 9: Исследования молодых ученых. 2013. № 11. Режим доступа: https://cyberleninka.ru/article/n/sravnitelnyy-analiz-algoritmov-raspoznavaniya-lits (Дата обращения: 25.05.2018).
  4. Моргунов А.В., Мансурова Д.А., Тюрин К.А. ПРОБЛЕМА РАСПОЗНА­ВАНИЯ ЛИЦ. ОБЗОР МЕТОДОВ ЕЕ РЕШЕНИЯ // Вопросы технических наук в свете современных исследований: сб. ст. по матер. IV междунар. науч.-практ. конф. № 4(3). – Новосибирск: СибАК, 2017. – С. 58-70.
  5. Полякова А.С. О применении библиотеки OpenCV в задаче распознавания лиц по их изображению // Актуальные проблемы авиации и космонавтики. 2016. № 12. Режим доступа: https://cyberleninka.ru/article/n/o-primenenii-biblioteki-opencv-v-zadache-raspoznavaniya-lits-po-ih-izobrazheniyu (Дата обращения: 25.05.2018).
  6. Face Recognition with OpenCV // opencv.org Режим доступа: https://docs.opencv.org/2.4/modules/contrib/doc/facerec/facerec_tutorial.html#face-recognition (Дата обращения: 22.05.2018).
  7. Анализ существующих подходов к распознаванию лиц // habr.com Режим доступа: https://habr.com/company/synesis/blog/238129/ (Дата обращения: 22.05.2018).
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий