Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: IV Международной научно-практической конференции «Естественные и математические науки в современном мире» (Россия, г. Новосибирск, 01 апреля 2013 г.)

Наука: Информационные технологии

Секция: Системный анализ, управление и обработка информации

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Шамин П.Ю., Номан М.А., Хорьков К.С. РАСПОЗНАВАНИЕ ИЗОБРАЖЕНИЙ КОМПЛЕКСОМ ДИФФЕРЕНЦИРУЮЩИХ МАСОК С ФИЛЬТРАЦИЕЙ // Естественные и математические науки в современном мире: сб. ст. по матер. IV междунар. науч.-практ. конф. – Новосибирск: СибАК, 2013.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Статья опубликована в рамках:
 
Выходные данные сборника:

 

РАСПОЗНАВАНИЕ  ИЗОБРАЖЕНИЙ  КОМПЛЕКСОМ  ДИФФЕРЕНЦИРУЮЩИХ  МАСОК  С  ФИЛЬТРАЦИЕЙ

Шамин  Павел  Юрьевич

канд.  техн.  наук,  инженер-программист  ИВЦ  ВлГУ,  г.  Владимир

E-mailtrace83@mail.ru

Номан  Мустафа  Абдулла  Али

Аспирант  ВлГУ,  г.  Владимир

Хорьков  Кирилл  Сергеевич

Аспирант  ВлГУ,  г.  Владимир

E-mailfreeod@mail.ru

 

Данная  работа  выполнена  в  рамках  НИР  по  госзаданию  «Наука»  (Регистрационный  номер:  8.3303.2011  от  23.11.2011).

 

Одним  из  востребованных  подходов  в  области  анализа  изображений  является  исследование  его  с  помощью  дифференцирующих  масок,  выделяющих  ту  или  иную  информацию  (см.,  например  [3]).  В  данной  статье  рассматривается  метод  сравнения  фрагментов  изображенияпо  текстурных  признакамc  использованием  согласованного  набора  дифференцирующих  масок.  В  более  ранней  статье  [1]  нами  предлагался  подобный  метод  для  сравнения  изображений  лиц.  В  настоящей  статье  используется  модификация,  этого  метода,  основанная  на  применении  определённого  вида  фильтрации.  Рассматриваемый  подход  может  иметь  применение  в  задачах  машинного  зрения,  автоматизированного  анализа  и  сегментации  изображений.

Метод  применим  к  растровым  полутоновым  двумернымизображениям,  полученным,например,  с  помощью  электронной  микроскопии.  Результаты,  приведённые  в  данной  статье  получены  на  изображении,  приведённом  на  рис.  1.

 

Рисунок  1.  Изображение  участка  микросхемы,  полученное  с  использованием  электронного  микроскопа

 

Ставится  задача  классификации  фрагментов  этого  изображения  по  текстуре  на  два  класса  («класс  а»  и  «класс  б»).  Примеры  изображений  обоих  классов  приведены  в  таблице  1.

Таблица  2. 

Фрагменты  тестового  изображения  с  различной  текстурой

Примеры  фрагментов  типа  «a»

Примеры  фрагментов  типа  «b»

 

 

 

 

 

 

 

Базовая  часть  метода  основана  на  использовании  текстурных  фильтров  Фрея-Чена  [2]  и  аналогична  рассмотренной  нами  в  [1],  основная  же  идея  фильтрации  заключается  в  следующем:  значительная  часть  большинства  реальных  изображений  неинформативна  (является  «гладкой»,  не  содержит  полезной  информации  о  неоднородностях  текстуры  изображения).  Использование  таких  частей  изображения  опасно,  поскольку  ничтожные  значения  величин  ABCD[1]  —  энергий  градиента,  пульсации,  линии  и  лапласианаобразуют  между  собой  практически  случайные  соотношения  и,  в  итоге,  искажают  вид  порядковой  гистограммы  в  том  варианте,  в  котором  она  описана  в  исходной  статье.

Предлагается  следующий  метод  борьбы  с  этим  явлением:  исключать  из  рассмотрения  часть  пикселов  изображения,  на  которых  энергия  константы  E  превышает  заданный  процент  от  суммы  всех  пяти  величин.  Для  этого  в  каждой  точке  изображения  вводится  величина  R  матрицазначений  которой  для  изображения  Y  может  быть  выражена  через  матрицы  ABCDE  следующим  образом:

 

,

где:  ÷  —  операция  поэлементного  вычисления  частного  от  деления.

Задав  порог  d  для  бинаризации  величины  R,  можно  получить  бинарную  матрицу  W:

 

 

Данная  матрица  может  быть  использована  при  построении  порядковой  гистограммы,  характеризующей  текстурные  признаки  изображения,  следующим  образом:  элементы  матриц  ABCD  соответствующие  единичным  элементам  матрицы  W,  считаются  неинформативными  и  не  используются.

Вопрос  оптимального  выбора  порога  d  требует  отдельного  исследования,  очевидно,  его  следует  выбирать  из  соображений  сохранения  достаточной  доли  пикселов  изображения,  участвующих  в  анализе.  В  частности,  результаты,  приведённые  в  данной  статье,  были  получены  при  пороге  d  =  0,995.

Примеры  фрагментов  тестового  изображения  с  различной  текстурой  и  соответствующих  им  матриц  для  d  =  0,995приведены  в  таблице  2.

Таблица  2. 

Фрагменты  тестового  изображения  и  их  матрицы  W

Примеры  фрагментовизображения

Матрицы  «информативных  областей»

 

 

 

 

 

После  построения  порядковых  гистограмм  сравнение  фрагментов  изображения  производится  по  следующему  принципу:  вычисление  расстояний  по  метрике  L1с  последующим  принятием  решения  по  пороговому  критерию.

Результаты  вычисления  расстояния  по  метрике  L1между  парами  тестовых  изображений  приведены  в  таблице  3,  из  которой  видно,  что  существует  порог,  который  позволяет  разделить  по  величине  внутриклассовые  и  межклассовые  расстояния  (то  есть  расстояния  между  парой  изображений  одного  класса,  таких  как,  например,  два  фрагмента  типа  «a»,  и  различных  классов  —  фрагмент  типа  «a»  и  фрагмент  типа  «b»).  В  частности,  если  выбрать  порог  принятия  решения  о  принадлежности  фрагментов  изображения  к  одному  классу  равным  0,3,  то  ниже  него  окажутся  только  внутриклассовые  расстояния  (выделены  зелёным  в  таблице  3).Ряд  параметров,  косвенно  характеризующих  качество  различения  приведён  также  в  таблице  4. 

Таблица  3. 

Расстояния  между  тестовыми  изображениями  по  метрике  L1

-

a1

a2

a3

a4

b1

b2

b3

b4

a1

0

0,111115

0,20636

0,182098

0,288971

0,226929

0,318756

0,299835

a2

0,111115

0

0,108521

0,086151

0,304779

0,244781

0,319885

0,298187

a3

0,20636

0,108521

0

0,026733

0,318359

0,26709

0,24176

0,23172

a4

0,182098

0,086151

0,026733

0

0,303772

0,252228

0,256653

0,23642

b1

0,288971

0,304779

0,318359

0,303772

0

0,072296

0,211853

0,201935

b2

0,226929

0,244781

0,26709

0,252228

0,072296

0

0,189575

0,173065

b3

0,318756

0,319885

0,24176

0,256653

0,211853

0,189575

0

0,033142

b4

0,299835

0,298187

0,23172

0,23642

0,201935

0,173065

0,033142

0

 

Таблица  4. 

Полученные  соотношения  между  расстояниями

Параметр

Без  фильтрации  (d=1)

С  фильтрацией  (d=0,995)

Среднее  внутриклассовое  расстояние:

0,13357

0,119539

Среднее  межклассовое  расстояние:

0,275633

0,722243

Среднее  отношение  межклассового  расстояния  к  внутриклассовому:

2,063578

6,041928

Максимальное  внутриклассовое  расстояние:

0,211853

0,238787

Минимальное  межклассовое  расстояние:

0,226929

0,574167

Наихудшее  отношение  межклассового  расстояния  к  внутриклассовому:

1,071161

2,404518

 

Как  видно  из  таблицы  4,  метод  с  фильтрацией  обеспечивает  гораздо  более  качественное  разделение  классов  текстур  изображений  (фрагмент  типа  «a»  и  фрагмент  типа  «b»).

С  учётом  полученных  результатов  можно  рекомендовать  данный  подход  (в  том  числе  с  другими  наборами  дифференцирующих  масок)  для  применения  в  различных  радиотехнических  системах,  решающих  задачи  компьютерного  зрения,  анализа  изображений  и  сигналов,  например  для  целей  сегментации,  выделения  специфических  областей  изображения,  автоматического  позиционирования  по  изображению  и  т.  д.

 

[1]  Смысл  этих  величин  и  способ  построения  порядковых  гистограмм  описаны  в  [1].

 

Список  литературы:

1.Звягин  М.Ю.  Распознавание  людей  по  изображению  лица  с  использованием  текстурных  характеристик  /  М.Ю.  Звягин,  В.Г.  Прокошев,  О.А.  Новикова,  П.Ю.  Шамин  //  Труды  XVII  Всероссийской  научно-методической  конференции  «Телематика'2010»  Том  1.  Секция  A.  —  21—24  июня  2010  года,  СПб.  —  С.  257—259.  —  ISBN  978-5-7577-0354-1.

2.Шапиро  Л.  Компьютерное  зрение  /  Л.  Шапиро,  Дж.  Стокман;  Пер.  с  англ.  —  М.:  Бином.  Лаборатория  знаний,  2006.  —  752  с.  —  ISBN  0-13-030796-3  (англ.),  ISBN  5-94774-384-1  (русск.).

3.Грузман  И.С.  Синтез  оптимальных  дифференциаторов  для  алгоритма  обнаружения  локально  ориентированных  текстур  //  Компьютерная  оптика,  том  36,  №  1,  2012  г.  —  С.  109—114. 

 
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.