Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LX Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 10 января 2019 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Клюев В.В. ОБНАРУЖЕНИЕ ОБЪЕКТОВ В ВИДЕОПОТОКЕ С ПОМОЩЬЮ МЕТОДА ВИОЛЫ-ДЖОНСА // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. LX междунар. студ. науч.-практ. конф. № 1(60). URL: https://sibac.info/archive/meghdis/1(60).pdf (дата обращения: 22.12.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 81 голос
Дипломы участников
Диплом Интернет-голосования

ОБНАРУЖЕНИЕ ОБЪЕКТОВ В ВИДЕОПОТОКЕ С ПОМОЩЬЮ МЕТОДА ВИОЛЫ-ДЖОНСА

Клюев Вячеслав Витальевич

студент, Сибирского государственного университета науки и технологий имени академика М.Ф. Решетнева,

РФ, г. Красноярск

АННОТАЦИЯ

В данной статье рассмотрен один из алгоритмов компьютерного зрения – метод Виолы – Джонса.

 

Ключевые слова: метод Виолы-Джонса; обнаружение объектов; компьютерное зрение.

 

В настоящее время обнаружение объектов на видеоданных имеет множество применений. Развитие этого направления позволяет решить задачи, связанные с охранными системами, верификацией, криминалистической экспертизой. Одним из наиболее важных применений является обработка изображений в медицине. Исследование информации, получаемой из медицинского оборудования способствует постановке диагноза пациентам.

Метод Виолы-Джонса позволяет обнаруживать объекты на изображениях в реальном времени. Основой метода являются признаки в форме прямоугольных регионов, которые очень похожи на вейвлеты Хаара. В отличии от вейвлетов Хаара они сложнее и имеют более одной прямоугольной плоскости.

 

Рисунок 1. Признаки Хаара [2]

 

Особенной чертой алгоритма Виолы-Джонса является преобразование изображения в интегральный формат. Двумерная матрица, состоящая из элементов, каждый из которых содержит сумму яркости всех пикселей, находящихся левее и выше данного. Вычислительная сложность расчета этой матрицы занимает линейное время. Вычисляется по формуле:

                                               (1)

где:  — яркость пикселя исходного изображения.

Для вычисления суммы яркостей пикселей прямоугольной области на изображении, представленном в интегральном формате, требуется 7 операций (4 обращения к матрице и 3 арифметические). Такое сокращение операций вычисления оказывает значительный прирост производительности при многократных расчетах признаков.

 

Рисунок 2. Прямоугольная область интегрального изображения [2]

 

Сумму яркости пикселей внутри прямоугольника ABCD можно выразить следующей формулой:

                              (2)

Значение признаков Хаара вычисляются по формуле:

                                                                (3)

где:  – сумма яркости пикселей, находящихся на белой части признака;  – сумма яркости пикселей, находящихся на черной части признака.

Алгоритм сканирования окна состоит из следующих шагов:

  1. Выбираются размер окна сканирования и используемые признаки;
  2. Окно сканирования начинает последовательно двигаться по изображению с заданным шагом;
  3. В каждом окне вычисляются различные варианты расположения признаков Хаара, изменяется их масштаб и положение;
  4.  Классификатор обрабатывает значения вычисленных признаков и принимает решение о наличии объекта в области сканирования;
  5. Окно сканирования масштабируется, происходит повторение предыдущих шагов.

Для обучения алгоритма подготавливается тестовая выборка изображений, содержащих искомый объект в чёрно-белом формате. Для каждого признака Хаара тренируется слабый классификатор, целью котрого является обнаруживать присутствие объекта с вероятностью более 50%. Такая низкая точность распознавания обуславливается тем, что из слабых классификаторов с помощью технологии AdaBoost будет собираться сильный классификатор, имеющий высокую точность.

Процесс поиска объектов в сканируемом окне использует каскадную модель сильных классификаторов. Для того, чтобы объект был распознан, необходимо подтверждение всех сильные классификаторов. Если хотя бы один из них дает отрицательный результат, то предположение, что обнаружен искомый объект отвергается.

 

Рисунок 3. Каскадная модель

 

Основным минусом данного метода является большой объем данных необходимых для обучения и соответственно время обучения. Благодаря открытой библиотеке компьютерного зрения OpenCV, которая содержит уже готовые наборы обученных данных, нет необходимости проходить этот длительный этап, что является преимуществом по сравнению с другими методами. Метод Виолы-Джонса приобретает привлекательность вследствие простоты настройки и высокой скорости обработки.

 

Список литературы:

  1. Viola P., Jones M. J. Robust real-time face detection // Intern. J. of Computer Vision. 2004. Vol. 57, N 2. P. 137—154.
  2. Метод распознавания лиц Виолы-Джонса (Viola-Jones) // Dmitriy Azarov. URL: https://oxozle.com/2015/04/11/metod-raspoznavaniya-lic-violy-dzhonsa-viola-jones/ (дата обращения: 10.01.2019).
  3. Метод Виолы-Джонса (Viola-Jones) как основа для распознавания лиц // Хабр. URL: https://habr.com/post/133826/ (дата обращения: 10.01.2019).
Проголосовать за статью
Конференция завершена
Эта статья набрала 81 голос
Дипломы участников
Диплом Интернет-голосования

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.