Статья опубликована в рамках: Научного журнала «Студенческий» № 35(247)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6

Библиографическое описание:

Резниченко Д.В. ТЕХНОЛОГИЯ РАСПОЗНАВАНИЕ ЛИЦ В СОВРЕМЕННОМ МИРЕ // Студенческий: электрон. научн. журн. 2023. № 35(247). URL: https://sibac.info/journal/student/247/304757 (дата обращения: 28.07.2026).

ТЕХНОЛОГИЯ РАСПОЗНАВАНИЕ ЛИЦ В СОВРЕМЕННОМ МИРЕ

Резниченко Дмитрий Владимирович

магистрант, Сибирский государственный индустриальный университет,

РФ, г. Новокузнецк

Турчанинов Евгений Борисович

научный руководитель,

канд. техн. наук, доц., Сибирский государственный индустриальный университет,

РФ, г. Новокузнецк

АННОТАЦИЯ

В статье рассмотрен общий обзор системы распознавания лиц. Перечислены основные методы распознавания, применение в 2D и 3D распознавание, а также кратко изложены критерии качества программного обеспечения.

ABSTRACT

The article provides a general overview of the face recognition system. The main recognition methods, applications in 2D and 3D recognition are listed, and the software quality criteria are briefly outlined.

Ключевые слова: интеллектуальные системы, нейронные сети, машинное обучение.

Keywords: intelligent systems, neural networks, machine learning.

Распознавание лиц (Face Recognition - англ.) — это одна из наиболее перспективных методов биометрической бесконтактной идентификации человека.

Изначально системы распознавания лиц были разработаны в виде программ, устанавливаемых на компьютеры. В настоящее время технология распознавания лиц наиболее широко применяется в системах видеонаблюдения, контроля доступа, а также на различных мобильных и облачных платформах. В 2017 году журнал Массачусетского технологического института - MIT Technology Review включил технологию распознавания лиц в список 10 прорывных технологий 2017 года. Например, в Китае в базе данных единой системы слежения и распознавания более миллиарда человек. В реальном времени система использует 170 миллионов камер.

Китайцы планируют расширить свою систему видеонаблюдения, поскольку, на их взгляд, она не является идеальной: в ближайшие три года планируется добавить около 400 миллионов камер. Это позволит увеличить масштаб, где полмиллиарда камер будут отслеживать 1,4 млрд человек в режиме реального времени.

В основе системы распознавания лиц лежит процесс сравнения лиц, зафиксированных на камере, с ранее сохраненными и идентифицированными в базе данных образцами лиц. По структуре оно делится на три основные схемы.

Анализ видеопотока на сервере.

Широко используемая схема — IP-камера передает видеопоток на сервер, там выполняется анализ видеопотока и сравнение полученных из него изображений лиц, с базой лиц эталонов (рис. 1).

Рисунок 1. Упрощённая схема передача видеоданных на сервер с IP камеры

Однако такая схема имеет ряд недостатков, таких как:

Высокая нагрузка на саму сеть;
Большая стоимость сервера (чем больше сиситема, тем больше требуется серверов для подключения камер и обработки полученных с них данных).

Так же данная схема имеет и преимущества, так как позволяет использовать уже существующую систему видео наблюдения.

Анализ видеопотока на IP-камере.

В такой схеме анализ изображения производится на самой камере, а сервер получает уже обработанные метаданные (рис. 2)

Рисунок 2. Упрощённая схема передача метаданных на сервер с IP камеры

Такая схема имеет ряд недостатков:

Требуется использовать специальные камеры (которые ограничены по выбору, что только повышает их стоимость);
Большое разнообразие методов хранения баз данных, а также взаимодействия программного обеспечения камер и сервера.

Однако хоть ее недостатки увеличивают стоимость покупки и обслуживания оборудования, но такой подход позволяет подключать практически любое число камер к одному серверу.

Анализ видеопотока на устройстве контроля доступа

Данная схема не использует IP-камеры как предыдущие, так как ее встроенная камера располагается в устройстве контроля доступа (рис. 3). Обычно такая система осуществляет контроль доступа (через турникеты, электрозамки на дверях и т.п.) путем распознавания лиц и сравнения их с базой данных эталонных лиц, которая хранится на самом устройстве и не имеет, как правило, формат изображений.

Рисунок 3. Упрощённая схема передача метаданных на сервер с устройства контроля

Основной минус данной системы является то, что такие устройства не адаптированы к воздействию внешних природных факторов, отчего использование из ограниченно (используются только в помещениях).

Но так как такие устройства стоят относительно дешево, то они имеют большое преимущество над другими системами видеонаблюдении в вопросах осуществления контроля доступа.

Однако при любом раскладе, успех по реализации таких проектов напрямую зависит от используемого алгоритма для распознавания, качественной базы эталонных лиц и скорости работы алгоритма по их сравнению.

Технология распознавания лиц

Что из себя представляет система по распознаванию лиц? Если отвечать кратко, то это камера видеонаблюдения и специальное программное обеспечение, которое анализирует полученное изображение. Программное обеспечение, для осуществления анализа и сравнения изображения с помощью сложных математических алгоритмов, очень сильно нагружает сервер, из чего можно сделать вывод, что для нее нужен более мощный сервер по сравнению с теми, что используются для простого видеонаблюдения.

Исходя из выше перечисленных схем можно сделать вывод, что в первую очередь следует обращать внимание на качество используемого программного обеспечения, далее следует проанализировать требуемые серверные ресурсы для анализа изображений и их сравнения с эталонной базой, но и не стоит забывать о применение IP-камер.

Отдельно можно рассмотреть такое устройство как «stand alone», которое может осуществлять обработку и сравнение изображения на самом устройстве и хранение эталонной базы на нем же.

2D-распознавание лиц

На текущий момент времени одной из наиболее востребованных технологий является распознание 2D изображений, в его основе лежат плоские двухмерные изображения, а также применение различные алгоритмов для их сравнения.

Востребованность данной технологии связанно с тем, что в мире существует огромное количество баз данных, где персоны идентифицируются именно по 2D изображению лиц и более того, большинство оборудования, используемого во всем мире, основано на 2D технологиях.

Так же спрос на данную систему распознавания лиц объясняет постоянный закуп камер по всему миру, только в России на 2022 год установлено 21 миллион камер.

Спрос рождает предложение и поэтому разработчики всего мира пытаются улучшить данную технологию, а иногда это приводит к созданию чего-то нового, например, создание 3D модели лица на основе 2D изображения.

В университете Ноттингема и Кингстона был представлен проект по воссозданию 3D модели лица на основе 2D изображения с помощью применения нейросетей.

2D распознавание лиц имеет свои преимущества, включая наличие готовых баз данных с эталонами лиц и уже существующей инфраструктуры. Этот сегмент также будет иметь максимальный спрос, что будет стимулировать разработчиков улучшать технологии.

Однако данная система имеет недостатки, выраженные в повышенном значение ошибок FAR и FRR в сравнение с 3D.

3D-распознавание лиц

Текущая технология обладает повышенными качественными характеристиками в сравнение с другими технологиями, а для ее работы обычно используется восстановленные 3D модели, но и она имеет ряд ограничений.

Можно лишь поражаться обилием доступных технологий для 3D сканирование, здесь и всевозможные лазерные сканеры, и сканеры с подсветкой поверхности и математической обработкой изгибов полос, а также сканеры, использующие фотографический метод синхронного съема стереопары, и т.п.

Одной из самых популярных, изученных и оцененных технологий является Face ID, разработанная компанией Apple, которое является единственным коммерчески доступным устройством.

3D технология от Apple единственная в мире использует - вертикально-излучающие лазеры (VCSEL), по слухам суммарно потратив на разработку Face ID от 1,5 до 2 миллиардов долларов. Поставщиком VCSEL для Apple выступают две компании Finisar Corp (инвестиции Apple - 390 млн. долларов) и Lumentum Holdings.

Данная технология, по сравнению с 2D системами, имеет более высокую точность и меньшее количество ошибок.

3D распознавание лиц имеет ряд преимуществ по сравнению с 2D системами, таких как высокая точность и меньшее количество ошибок, что пока еще недостижимо для 2D технологий.

Технология 3D распознавания лиц имеет недостатки и может быть относительно легко подделана опытными специалистами. Например, сразу после выпуска Face ID компания Bkav из Вьетнама смогла взломать эту систему, создав маску с использованием 3D принтера. Затраты на создание такой маски составили всего $150.

Данная технология не подходит для обеспечения безопасности устройств и помещений, так как она может быть легко взломана при достаточных навыках.

Так же следует отметить, что для проведения 3D распознавания лиц требуются специальные сканирующие камеры, которые по стоимости превышают камеры для 2D. Не мало важный минус дает то, данная технология не имеет готовых баз данных, а также для нее, как и для 2D технологии, будет сложной задачей распознавание близнецов.

Важную роль играет высокое разрешение изображения, благодаря этому можно захватить определенную область кожи лица в виде изображения и разбить его на мелкие блоки, которые преобразуются в математически измеримые пространства. Такой метод позволяет улучшить анализ и сравнение 3D изображений.

В настоящее время использование тепловизионных камер в целях распознавания лиц считается перспективным направлением развития. Однако, пока не существует готовых коммерческих решений для их внедрения.

Технология 3D распознавания лиц обладает большим потенциалом, так как позволяет преодолеть недостатки, присущие 2D-распознаванию лиц. Она способна решить проблемы и недочёты, связанные с 2D-моделями, такие как: распознавание лиц в темноте; распознавании лиц с нанесенным макияжем, растительностью на лице (борода, усы) или в аксессуарах (шляпа, очки); а также позволяет распознавать близнецов.

Выделяются два перспективных направления, в области которых ведется разработка. Это «идентификация по заранее созданным термограммам идентифицированных лиц» и «идентификация человека по изображениям, полученным с обычных 2D изображений». Если в первом направление решается задача с тем, что в нем нет готовых баз данных эталонных лиц, то во втором – задача решается с помощью использования глубоких нейронных сетей.

На данный момент времени эти технологии, в области которых ведется разработка, работают только в лаборатории и не идеально.

Качество программного обеспечения

Существует несколько важных метрик для оценки качества программного обеспечения, наиболее важные из них FRR и FAR.

False Reject Rate — FRR (Уровень ошибочных отказов) — вероятность того, что система не идентифицирует зарегистрированного пользователя или не подтверждает его подлинности.

Как рассчитывается FRR:

Пусть Nt — количество эталонов изображений в базе данных. FR — количество ложных не распознаваний (False Reject — Иванов, не распознан как Иванов).

(1)

• False Acceptance Rate — FAR (Уровень ошибочных подтверждений) — вероятность того, что система распознавания лиц ошибочно идентифицирует незарегистрированного пользователя или подтверждает его подлинность.

Как рассчитывается FAR:

Пусть Nt — количество эталонов изображений в базе данных. FA — количество ложных распознаваний (False Acceptation — Иванов распознан как Петров).

(2)

Самое основное заключается в том, что данные метрики являются относительными, а не абсолютными значениями и могут меняться в зависимости от настроек используемого алгоритма (рис. 4).

Рисунок 4. Сравнение коэффициентов FAR и FRR для 2D и 3D распознавания лиц

Кроме того, наблюдается обратная зависимость данных метрик друг от друга: если FAR уменьшается, то FRR увеличивается (рис. 5).

Рисунок 5. Ориентировочные значения FRR и FAR для систем распознавания лиц

Множество компаний разрабатывают алгоритмы распознавания, но есть и те, что проводят контроль эффективности этих алгоритмов (рис. 6). Некоторыми из самых известных таких организаций являются NIST - Национальный институт стандартов и технологий США, MegaFace - проект Вашингтонского университета, а также Labeled Faces in the Wild. Результаты этих тестов регулярно обновляются, и любая компания в любой момент может обновить свой результат, пройдя повторное тестирование. Недавно NtechLab объявила о своей победе, но в настоящий момент они занимают только 4-е место.

Рисунок 6. Сравнение FAR и FRR различных методов биометрической идентификации

Список литературы:

Брилюк Д.В., Старовойтов В.В. / Распознавание человека по изображению лица нейросетевыми методами – Минск: Институт технической кибернетики, 2002.
Кухарев Г.А. / Методы обработки распознавания изображения лиц в задачах биометрии / Каменская Е.А., Матвеев Ю.Н.; под ред. Хитрова М.В. – Спбю: Политехника, 2013. – 388с.: ил.