Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XXV Международной научно-практической конференции «Технические науки - от теории к практике» (Россия, г. Новосибирск, 04 сентября 2013 г.)

Наука: Технические науки

Секция: Информатика, вычислительная техника и управление

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Кузьмин С.А. СЕГМЕНТАЦИЯ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ИЗОБРАЖЕНИЙ С РЕГУЛИРУЕМОЙ ТОЧНОСТЬЮ И ВИЗУАЛИЗАЦИЯ ЭФФЕКТИВНОСТИ // Технические науки - от теории к практике: сб. ст. по матер. XXV междунар. науч.-практ. конф. № 8(21). – Новосибирск: СибАК, 2013.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов
Статья опубликована в рамках:

 

Выходные данные сборника:

 

СЕГМЕНТАЦИЯ  ПОСЛЕДОВАТЕЛЬНОСТЕЙ  ИЗОБРАЖЕНИЙ  С  РЕГУЛИРУЕМОЙ  ТОЧНОСТЬЮ  И  ВИЗУАЛИЗАЦИЯ  ЭФФЕКТИВНОСТИ

Кузьмин  Сергей  Александрович

старший  преподаватель,  СПбГУАП,  Санкт-Петербург

E-mail:  

 

SEGMENTATION  OF  IMAGE  SEQUENCES  WITH  CONTROLLED  ACCURACY  AND  VISUALISATION  OF  PERFORMANCE

Kuzmin  Sergey  Alexandrovich


teaching  fellow,  SPb  SUAI,  Saint-Petersburg

 


АННОТАЦИЯ

Для  снижения  вычислительной  сложности  анализа  изображений  большой  площади  стараются  сначала  найти  интересующие  объекты  на  низком  разрешении,  а  затем  уже  рассмотреть  их  на  более  высоком  разрешении.  Описывается  семейство  алгоритмов  сегментации  изображений  с  движущимися  объектами  и  методики  визуализации  эффективности  алгоритмов  сегментации  и  шумоподавления.


ABSTRACT

For  reduction  of  the  computational  complexity  of  image  analysis  with  large  area  it  is  common  practice  at  first  to  find  objects  at  a  low  resolution,  and  then  to  gaze  them  at  a  higher  resolution.  This  article  is  devoted  to  a  family  of  algorithms  for  segmentation  of  images  and  techniques  for  visualization  of  effectiveness  of  segmentation  and  noise  reduction  algorithms.

 

Ключевые  слова:  вейвлет  преобразование,  сегментация,  пирамида  изображений,  фильтрация  изображений,  ROC  характеристика.  

Keywords:  wavelet  transform,  segmentation,  image  pyramid,  image  filtering,  ROC  curve.

 

Семейство  алгоритмов  сегментации  с  различной  точностью

В  2006,  2007  и  2013  годах  были  разработаны  идейно  близкие  способы  локализации  объектов  с  пониженной  [5],  нормальной  [3]  и  повышенной  (субпиксельной)  точностью.  Основная  идея  заключается  в  объединении  изменяющихся  участков  кадра  («движущихся  областей»)  и  смещающихся  контуров  объектов  («движущихся  контуров»)  с  помощью  операции  «ИЛИ».  

Изменение  пространственной  точности  определения  координат  объектов  связано  с  вычислением  нужного  уровня  пирамиды  разрешений.  В  отличие  от  наиболее  часто  рассматриваемых  способов  построения  пирамиды,  направленных  только  на  снижение  разрешения,  в  статье  рассматривается  и  способ  увеличения  разрешения  изображения.  

Первый  разработанный  алгоритм  представлен  на  рис.  1.  

 


Рисунок  1.  Блок-схема  алгоритма  сегментации,  основанного  на  разнице  «нулевых»  уровней  вейвлет-преобразований

 

В  нём  нет  изменения  площади  яркостной  составляющей  кадра,  поэтому  можно  говорить,  что  он  связан  с  «нулевым  уровнем»  вейвлет-преобразования:  .  Вейвлет-преобразование  имитируется  путем  вычисления  контуров  фильтром  Превитт.  Разностные  кадры  бинаризуются  и  объединяются  с  помощью  операции  «ИЛИ».  

Традиционное  направление  связано  с  понижением  разрешения  изображения.  Ранее  это  было  актуально  из-за  низкой  скорости  вычислений  даже  на  небольших  изображениях.  Сейчас  размеры  изображений  стремительно  растут,  а  также  в  СПБГУАП  активно  развивается  направление  видеопанорам,  поэтому  скорость  вычислений  по-прежнему  является  больной  точкой  и  понижение  разрешения  актуально  в  случае  обработки  изображений  больших  площадей.  В  теории  рассматриваются  разные  способы  вычисления  сглаженной  и  прореженной  версии  изображения  (Гауссиан  [10],  фильтр  Габора  [9],  среднее,  минимальное  или  максимальное  значение,  полусумма  минимального  и  максимального  значений,  медиана  участка  изображения  предыдущего  уровня  пирамиды[1],  морфологическая  операция  «размыкание»  (чередование  базовых  операций  «эрозия»  и  «наращивание»),  вейвлет  преобразование  [8]).  В  данной  работе  используются  вейвлеты.

Второй  разработанный  алгоритм  основан  на  настоящем  вейвлет  преобразовании.  На  основании  исследований  [7]  для  вычисления  низкочастотной  (НЧ)  и  высокочастотных  (ВЧ)  составляющих  был  выбран  вейвлет  Хаара.  После  прямого  двумерного  дискретного  вейвлет  преобразования  (ДВП)  изображения  кадра  три  высокочастотных  диапазона,  соответствующих  изменениям  в  горизонтальном,  вертикальном  и  диагональном  направлениях,  объединяются  суммированием  амплитуд  трансформант  с  проверкой  переполнения  разрядной  сетки:

 


.

 

Аналогичные  операции  производятся  для  изображения  оценки  фона.  Затем  следует  попарное  вычисление  разниц  НЧ  и  объединенных  ВЧ  составляющих  (рис.  2).  Объединение  бинаризованных  разностных  изображений  производится  также  с  помощью  операции  «ИЛИ».

 


Рисунок  2.  Блок-схема  алгоритма  сегментации,  основанного  на  разнице  первых  «отрицательных»  уровней  вейвлет  преобразований

 

Размеры  получаемых  изображений  в  4  раза  меньше,  чем  исходных,  то  есть  можно  сказать,  что  речь  идет  о  первом  отрицательном  уровне  разложения:  .  Более  глубокие  «отрицательные  уровни»  разложения  получаются  применением  вейвлет  преобразования  к  НЧ  составляющей  ДВП,  а  затем  осуществлением  объединения  ВЧ  диапазонов.

Если  требуется  точность  определения  координат  объектов  меньше  пикселя,  то  необходимо  задуматься  о  реализации  «положительных  уровней»  разложения,  т.  е.  повышении  площади  яркостной  составляющей  изображения  (рис.  3).  Первые  работы  в  направлении  повышения  разрешения  изображений  с  помощью  вейвлет-преобразования  были  сделаны  в  начале  2000-х  годов  [11].

 


Рисунок  3.  Блок-схема  алгоритма  обнаружения,  основанного  на  разнице  первых  «положительных»  уровней  вейвлет  преобразований

 

Размеры  получаемых  изображений  в  4  раза  больше,  чем  исходных,  то  есть  можно  сказать,  что  речь  идет  о  первом  положительном  уровне  разложения:    (такие  обозначения  введены  из-за  специфики  процесса  вычисления  двумерного  вейвлет-преобразования,  каждый  уровень  которого  выполняется  в  два  этапа  —  сначала  по  горизонтали,  а  затем  по  вертикали).  Следующие  «положительные  уровни»  получаются  тем  же  способом  —  вычисление  контуров  изображения  в  трех  направлениях,  выполнение  обратного  вейвлет  преобразования.

Различие  между  алгоритмами  семейства  в  спектральной  области  приводит  к  отличающимся  характеристикам  их  эффективности.  При  вычислении  отрицательных  уровней  контуры  сильно  ослабляются,  что  приводит  к  потере  высокочастотной  энергии.  При  вычислении  положительных  уровней  контуры  растягиваются  в  пространстве,  что  снижает  их  крутизну  и  сдвигает  высокие  частоты  в  область  средних  частот.  Поэтому  по  наличию  высокочастотной  энергии,  критически  важной  для  выделения  «движущихся  контуров»,  можно  априорно  расположить  эффективность  алгоритмов  разных  уровней  в  следующем  порядке:  нулевой,  положительные,  отрицательные.  Это  подтверждается  результатами  эксперимента  (рис.  4).

 



Рисунок  4.  Графики  для  разных  уровней  семейства  алгоритмов.  Методы  сегментации:  зеленый  —  нулевой  уровень,  красный  —  плюс  первый,  синий  —  минус  первый.

 

Визуализация  эффективности  движения  к  требуемым  показателям  точности

Разработчику  заданы  минимально  приемлимые  значения  вероятностей  правильного  обнаружения  Рпо  и  ложной  тревоги  Рпо,  по  которым  можно  построить  минимально  приемлемую  целевую  характеристику  Рпо  =  f(Рпо).  Рассмотрим  понятие  зона  требуемой  точности  —  это  область  в  верхнем  левом  углу  характеристики  Рпо  =  f(Рлт),  ограниченная  требуемыми  значениями  Рпо  и  Рлт,  в  которой  должна  находиться  хотя  бы  одна  точка  целевой  характеристики.  Для  примера  на  рис.  5  показана  зона  требуемой  точности  в  виде  квадрата  (1),  одна  из  целевых  характеристик  (2)  и  характеристика  алгоритма  сегментации  (3).

Как  правило,  характеристика  алгоритма  сегментации  сильно  отличается  от  целевой  характеристики.  Конкретная  точка  на  характеристике,  соответствующая  определенному  соотношению  белых  и  черных  пикселей,  выбирается  критерием.  Соответственно  на  начальном  этапе  выбранная  критерием  рабочая  точка  находится  далеко  от  зоны  требуемой  точности.  Тогда  возникает  желание  скачком  переместиться  поближе  к  этой  зоне.  Для  реализации  такого  скачка  часто  используют  объединение  двух  и  более  алгоритмов  сегментации.  

 


Рисунок  5  Пояснение  к  построению  зоны  требуемой  точности  и  одной  из  целевых  характеристик  Рпо=f(Рлт).

 

После  объединения  изображений  —  результатов  работы  алгоритмов  сегментации  —  получается  изображение  с  определенными  мощностями  множеств  черных  и  белых  пикселей.  Эти  мощности  определяют  значения  показателей  Рпо,  Рлт,  то  есть  точку  в  пространстве  характеристики  Рпо=f(Рлт).  Через  эту  точки  проходит  зависимость  Рпо=f(Рлт)  объединенного  алгоритма.  Если  полученная  точка  всё  еще  далека  от  зоны  требуемой  точности,  то  полученное  бинарное  изображение  можно  объединять  еще  с  каким-то  алгоритмом  сегментации  или  применять  к  нему  фильтры.  Это  приведет  к  появлению  еще  одной  точки  в  пространстве  Рпо=f(Рлт).  Эти  точки,  получаемые  после  каждого  блока  обработки,  можно  отобразить  в  виде  графика  рабочих  точек  (рис.  6).  Таким  образом,  в  процессе  создания  алгоритма  анализа  видеоинформации  разработчик  реализует  одну  из  траекторий  движения  к  зоне  требуемой  точности,  создавая  набор  смещающихся  характеристик  Рпо=f(Рлт).

 


Рисунок  6.  График  рабочих  точек  в  пространстве  характеристики  Рпо=f(Рлт)  для  алгоритма  «нулевого  уровня».  Цифрами  обозначены  рабочие  точки  после  этапов  обработки  изображения.

 

Особенностью  разработанного  семейства  алгоритмов  сегментации  являются  необычная  траектория  движения  к  целевым  показателям  (целевой  характеристике),  получающая  после  объединения  алгоритмов  с  помощью  операции  «ИЛИ».  Нестандартной  она  является,  т.  к.  наиболее  распространены  подходы  объединения  с  помощью  операции  «И»  или  построенные  на  определенных  правилах.  

Алгоритмы  сегментации,  построенные  на  операции  «ИЛИ»,  в  результате  объединения  получают  высокую  вероятность  ложных  тревог  и  высокую  вероятность  правильного  обнаружения.  Таким  образом,  разработчик,  реализующий  операцию  «ИЛИ»  должен  разработать  алгоритмы  подавления  шумов,  чтобы  приблизиться  к  зоне  требуемой  точности.  

Визуализация  эффективности  подавления  шума  

Объединение  результатов  работы  алгоритмов  сегментации  с  помощью  операции  «ИЛИ»  мало  исследовано  в  связи  с  возникающими  трудностями  из-за  возрастающей  вероятности  повреждения  изображения.  В  [4]  были  приведены  сведения  о  фильтрах,  позволяющих  значительно  снизить  вероятность  повреждения  изображения  в  блоках  подавления  шума.  К  фильтрам  подавления  шума  относится  многошаговый  медианный  фильтр  (см.  [2,  с.  124—125]).  

Для  иллюстрации  эффективности  фильтрации  изображений  в  [6]  предложен  способ  визуализации  «гистограмма  связности».  Каждый  пиксель  растрового  изображения  имеет  вокруг  себя  некоторое  количество  других  пикселей  —  множество,  называемое  окрестностью  этого  пикселя.  Обозначим  символом  С  количество  анализируемых  пикселей,  окружающих  пиксель  I[x,y],  т.  е.  количество  проверяемых  связей.  Пиксель  изображения  считается  «связанным»  с  соседним  пикселем,  принадлежащим  окрестности,  если  их  яркости  одинаковы.  Обозначим  количество  соседей  пикселя  символом  U[x,y].  Обозначим  количество  пикселей  изображения,  имеющих  одинаковую  связность,  символом  WU,  где  U[0..С].

Понятия,  характеризующие  изображение:

1.  гистограмма  связности  изображения  (области)  —  это  гистограмма,  в  которой  отражается  статистика  области  ,  где    —  площадь  изображения.  Под  выделенными  пикселями  понимаются  пиксели  того  цвета,  который  в  данный  момент  представляет  интерес  (как  правило,  белый  в  бинарных  изображениях);  

2.  общее  количество  соседей  у  всех  выделенных  пикселей  —  это  величина  ,  где    —  количество  связей  у  выделенного  пикселя;  

3.  средняя  связность  изображения  —  это  величина  ,  где    —  общее  количество  выделенных  пикселей.

Примеры  построения  гистограмм  связности  приведены  на  рис.  7—9.

 


Рисунок  7.  Исходное  бинарное  изображение  и  его  гистограмма  связности.  Средняя  связность  равна  5,3746

 


Рисунок  8.  Изображение  после  многошаговой  медианной  фильтрации  и  его  гистограмма  связности.  Средняя  связность  равна  6,0646

 


Рисунок  9.  Изображение  после  медианной  фильтрации  и  его  гистограмма  связности.  Средняя  связность  равна  6,8496

 

Импульсы  шума  представляют  из  себя  одиночные  резкие  скачки  яркости.  В  результате  у  зашумленного  изображения  средняя  связность  низкая.  В  ходе  обработки  фильтрами  на  основе  порядковой  статистики  связность  повышается  за  счет  подавления  одиночных  импульсов.

Заключение

По  проведенным  исследованиям  сделаны  следующие  выводы:

1.  к  семейству  алгоритмов  с  регулируемой  точностью  сегментации  добавлены  положительные  уровни,  что  позволяет  определять  положение  объектов  с  субпиксельной  точностью;

2.  наибольшая  точность  у  алгоритмов  «нулевого  уровня»;  

3.  разработана  методика  визуализации  эффективности  различных  этапов  в  процессе  сегментации  изображений;

4.  на  основе  методики  визуализации  «гистограмма  связности»  установлено,  что  классический  медианный  фильтр  эффективнее  многошагового  медианного  фильтра  в  подавлении  импульсного  шума.


 


Список  литературы:


1.Александров  В.В.,  Горский  Н.Д.  Представление  и  обработка  изображений.  Рекурсивный  подход.  Л.:  Наука,  1985.  —  192  с.


2.Егорова  С.Д.,  Колесник  В.А.  Оптико-электронное  цифровое  преобразование  изображений.  М.:  Радио  и  связь,  1991.  —  208  с.  


3.Кузьмин  С.А.  Обнаружение  движущихся  визуальных  объектов  на  основе  выделения  областей  и  контуров,  не  принадлежащих  фону//  Молодые  ученые  —  промышленности  Северо-Западного  региона:  Материалы  конференций  политехнического  симпозиума.  Декабрь  2006  года.  СПб.:  Изд-во  Политехн.  ун-та,  2006.  —  С.  56.


4.Кузьмин  С.А.  Исследование  комбинации  детектора  импульсного  шума  в  бинарных  изображениях  и  процентильных  фильтров//  «Естественные  и  математические  науки  в  современном  мире»:  материалы  IX  международной  заочной  научно-практической  конференции.  (19  августа  2013  г.)  Новосибирск:  Изд.  «СибАК»,  2013.  —  C.  34—44.


5.Кузьмин  С.А.  Обнаружение  визуальных  объектов  с  использованием  вейвлет-преобразования  и  оценивания  фона//Системы  управления  и  информационные  технологии,  2.1(28),  2007.  —  С.  158—162.


6.Кузьмин  С.А.  Повышение  вероятности  правильного  обнаружения  объектов  в  видеопоследовательности  с  помощью  ранговых  операторов//  Научная  сессия  ГУАП:  Сб.  докл.:  В  3  ч.  Ч.  II.  Технические  науки  /СПбГУАП.  СПб.,  2010.  —  С.  41—44.


7.Кузьмин  С.А.  Исследование  точности  сегментации  подвижных  объектов  с  использованием  вейвлетов  семейства  Добеши//  Научная  сессия  ГУАП:  Сб.  докл.:  В  3  ч.  Ч.  II.  Технические  науки  /СПбГУАП.  СПб.,  2008.  —  С.  32—35.


8.Харатишвили  Н.Г.,  Чхеидзе  И.М.  Морфологические  построения  в  кодировании  изображений.  Тбилиси:  Грузинский  технический  университет,  2009.  —  144  с.


9.Чочиа  П.А.  Пирамидальный  алгоритм  сегментации  изображений  //  Информационные  процессы,  —  Том  10,  —  №  1,  —  2010.  —  С.  23—35.


10.Burt  P.J.  and  Adelson  E.H.,  The  Laplacian  pyramid  as  a  compact  image  code,  IEEE  Trans.  Commun.,  —  vol.  31,  —  №  4,  —  pp.  532—540,  —  April  1983.


11.Shcherbakov  M.A.,  Schegolev  W.Y.  A  Wavelet-based  Technique  for  Image  Refinement,  EUSIPCO-2000,  Tampere,  pp.  1737—1739.

Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий