Статья опубликована в рамках: Научного журнала «Студенческий» № 21(65)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6
ЗАДАЧИ И МЕТОДЫ КОМПЬЮТЕРНОГО ЗРЕНИЯ
1. Основные определения и понятия компьютерного зрения.
Обработка и анализ изображений направлены на работу с двухмерными изображениями, одним из примеров может быть преобразование изображения. Примером могут послужить графические программы, позволяющие изменять исходное изображение в иное посредством применения фильтров для коррекции цвета, контрастности, изменения размеров изображения, устранения шумов, изменения границ и прочих операциях по преобразованию. Данные операции не зависят от наполнения изображений.
Восприятие трехмерных сцен по двумерным изображениям. Изображения часто являются двумерными проекциями трехмерных сцен. Для построения трехмерной интерпретации изображения могут быть использованы характерные признаки двухмерных изображений, такие как определение формы объекта по освещенности, текстурной информации, определение по контурам объекта, определение глубины с помощью фокусировки, признаки движения и т.д.
Распознавание образов – это область, которая применяется для распознавания объектов на изображениях по определенным характеристикам. Примером может быть распознавание символов на изображении или выделение определенных объектов на изображении для последующей обработки.
2. Задачи компьютерного зрения.
В задачи, рассматриваемые в области компьютерного зрения, входят:
Распознавание объектов с определенными характеристиками на изображении или видео. Система распознавания объектов должна обладать набором характеристик, которые она будет распознавать. Представление характеристик в наборе может быть точным (например, для распознавания лица человека), либо сформированным по большому количеству эталонных образцов (например, распознавание написанного от руки текста). Также представление может содержать специфические признаки объекта, такие как цвет, форма или какие-то особые признаки объекта, которые отличают его от подобных.
Использующиеся методы для устранения подобных проблем могут быть достоверно решены только для отдельных объектов: простые геометрические объекты, лица людей, печатные или рукописные тексты, автомобили. Для большей достоверности необходимы определенные условия, такие как определенное освещение, фон, положение объекта относительно камеры, фокусировка на объекте.
Существует несколько специализированных задач, основанных на распознавании изображений, например:
Поиск изображений по содержанию: нахождение отдельных изображений в большой коллекции изображений, которые имеют общий определенный признак.
Оценка положения: определение положения или ориентации определенного объекта относительно камеры.
Распознавание символов: распознавание символов на изображениях печатного или написанного от руки текста, обычно для перевода в текстовый формат.
Воссоздание 3D сцены по видео или изображениям.
Редактирование изображений/видео: преобразование исходного объекта обработки до определенного состояния (удаление шума, размытости, изменение яркости и контрастности, добавление определенных эффектов)
Выделение на изображениях структур определенного вида, сегментация изображений.
Анализ видеопотока: слежение за перемещением объектов (например, автомобилей или людей).
3. Области применения методов компьютерного зрения:
Медицина (автоматический анализ медицинских изображений: рентген, томография, УЗИ);
Системы безопасности (идентификация личности, детекторы движения, распознавание и отслеживание движущихся объектов, распознавание автомобильных номеров и т.д.);
Управление техникой на основе жестов, голосовых команд, нейроинтерфейсах;
Системы распознавания написанного от руки и печатного текста;
Промышленность (дефектоскопия, контроль качества, промышленные роботы): автомобилестроение, электроника, машиностроение.
4. Проблемы компьютерного зрения:
Одним из основных аспектов, является тот факт, что компьютерное зрение все еще не сравнимо с человеческой зрительной системой, которой оно по сути пытается подражать.
Алгоритмы компьютерного зрения могут быть довольно ненадежными. Компьютер может выполнять только те задачи, для которых он был обучен, и не справляется с новыми задачами, требующими другого набора данных.
Принципиальным отличием компьютерного зрения от различных устройств, использующих световой поток в качестве входных данных является способность анализировать поступающие данные на предмет выделения информации, требующейся для решения той или иной задачи. Существуют проблемы, связанные с полученными от распознавания данными:
- Неоднозначность и нарушение непрерывности при отображении трехмерного мира на двухмерный; существенное влияние внешних факторов, например освещения, движения объектов, и внутренних факторов на изменчивость результативных образов объектов. Основным средством обработки зрительных данных являются компьютеры или специальные вычислительные устройства. Для решения практических задач необходимо программное обеспечение для описания и хранения в компьютерах информации об объектах обработки. К настоящему моменту времени не существует развитого математического аппарата, на который могла бы опираться общая объектно-ориентированная модель данных. Поэтому практически в каждой конкретной разработке приходится создавать структуры описания объектов внешнего мира для применения к конкретной задаче.
- Требования реального времени. Анализ и распознавание данных требует больших ресурсов, даже без учета времени на их получение и сохранение. С дополнением ограничений, связанных с необходимостью получения зрительных данных и обработке их в темпе, задаваемом внешними процессами, сложность формирования математического и алгоритмического обеспечения возрастает многократно.
- Технические и организационные трудности. Использование компьютерного зрения является заманчивой перспективой во многих сферах человеческой деятельности, но количество мест с реальными возможностями внедрения, определяемых экономической целесообразностью существенно меньше. Как правило, к машинному видению обращаются при желании дооснастить этим средством уже действующие механизмы или технологические процессы, значительно реже формируется система, в которую закладывается как неотъемлемая часть. Аппаратные средства, используемые в компьютерном зрении, делятся на две основных категории:
- существующие средства, разработанные и широко используемые, ориентированные на человека как конечного потребителя зрительной информации;
- специализированные разработки, ориентированные на техническое использование.
5. Методы для решения проблем компьютерного зрения
В настоящее время область компьютерного зрения смещается от статистических методов к методам нейронных сетей глубокого обучения.
В компьютерном зрении по-прежнему остается много сложных проблем. Тем не менее, методы глубокого обучения достигают современных результатов по некоторым конкретным проблемам. Отдельная модель может изучать значение из изображений и выполнять задачи компьютерного зрения, устраняя необходимость в наборе специализированных и изготовленных вручную методов. Нейросети позволяют решить следующие проблемы компьютерного зрения:
- Классификация изображений - включает в себя назначение метки всему изображению;
- Обнаружение объекта – выделение одного или нескольких объектов на изображении;
- Сегментация объектов - это задача обнаружения объекта, когда вокруг каждого объекта, обнаруженного на изображении, рисуется линия
- Передача стиля изображения - это задача изучения стиля из одного или нескольких изображений и применения этого стиля к новому изображению.
- Раскраска изображения - окрашивание изображения или нейронное окрашивание включает в себя преобразование изображения в градациях серого в полноцветное изображение.
- Реконструкция изображения - задача заполнения недостающих или поврежденных частей изображения.
- Сверхразрешение изображения - создание новой версии изображения с более высоким разрешением и детализацией, чем у исходного изображения.
- Синтез изображений - создание целевых модификаций существующих изображений или совершенно новых изображений.
Список литературы:
- Л. Шапиро, Дж. Стокман. Компьютерное зрение = Computer Vision. — М.: Бином. Лаборатория знаний, 2006. — 752 с.
- Р.М. Мухамедияров. Машинное зрение: понятия, задачи и области применения [электронный ресурс] — Режим доступа. — URL: http://www.rusnauka.com/25_NPM_2009/Informatica/50975.doc.htm(дата обращения 01.04.2019)
Оставить комментарий