Статья опубликована в рамках: Научного журнала «Студенческий» № 22(276)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7
СОЗДАНИЕ БИНАРНЫХ МАСОК ДЕФЕКТОВ НА ОЦИФРОВАННЫХ ФОТОГРАФИЯХ
BINARY DEFECT MASKS creation ON DIGITIZED PHOTOS
Polina Voloshina
student, The Institute of Information Technologies, Sevastopol State University,
Russia, Sevastopol
Vadim Karlusov
scientific supervisor, Candidate of Technical Sciences, associate professor, Sevastopol State University,
Russia, Sevastopol
АННОТАЦИЯ
В статье описаны результаты обучения нейронной сети для решения проблемы построения бинарных масок дефектов на повреждённых оцифрованных фотографиях.
ABSTRACT
The paper describes the results of training a neural network to solve the problem of constructing binary defect masks on damaged digitized photographs.
Ключевые слова: бинарные маски дефектов, машинное обучение, дефекты на фотографиях, U-Net.
Keywords: binary defect masks, machine learning, defects in photos, U-Net.
Историческая память является фундаментом, на котором строится понимание прошлого, и архивные фотографии играют в этом процессе ключевую роль. Они позволяют увидеть, каким был мир в разные эпохи и сохранить историческую память о событиях, которые сформировали настоящее. Однако, несмотря на их значимость, многие старые фотографии со временем утрачивают свою первоначальную чёткость и качество, что затрудняет их использование для образовательных и исследовательских целей.
Цифровая обработка помогает сохранить визуальные свидетельства прошлого. Современные технологии позволяют не только восстановить утраченную чёткость и детализацию старых снимков, но и защитить их от дальнейшего разрушения.
Наиболее простым и доступным способом восстановить различные дефекты на оцифрованных снимках является ручная обработка при помощи растровых графических редакторов. Однако, восстановление дефектов и улучшение оцифрованных фотографий при помощи автоматических инструментов и программ значительно упрощает процесс и экономит время по сравнению с ручной реставрацией. Современные алгоритмы машинного обучения и искусственного интеллекта являются надёжным и крайне полезным инструментом для решения задачи восстановления [1].
Для того, чтобы восстанавливать дефекты в автоматическом режиме, до того, как перейти к ретушированию и устранению повреждений, требуется обнаружить и точно определить расположение дефектов на каждом снимке. Как правило, разметка дефектов представляется в виде бинарных масок, где каждый пиксель отмечен либо как часть дефекта (значение 1), либо как фон (значение 0).
Для решения этой задачи отлично подходят нейронные сети и машинное обучение, благодаря своей способности к обучению на больших объемах данных и выявлению сложных паттернов в изображениях. Сегментация требует точного определения границ дефектов и их классификации, что нейросети выполняют с помощью глубокого обучения. Архитектуры, такие как свёрточные нейронные сети (CNN), специализированы на извлечении признаков из изображений, что позволяет им точно определять расположение и характер дефектов, даже если они могут иметь различные формы и размеры [2].
Одной из популярных архитектур является U-Net. U-Net представляет собой сеть, специально разработанную для сегментации медицинских изображений, но она также успешно применяется в других областях, включая реставрацию фотографий. Она имеет архитектуру энкодер-декодер с использованием сверточных слоев и пулинга для извлечения признаков и последующего восстановления пространственного разрешения изображения. Благодаря особенностям архитектуры, U-Net отлично справляется с сегментацией и построением бинарных масок дефектов [3].
Для того, чтобы сеть могла решать задачу построения бинарных масок дефектов, её требуется обучить. Для обучения сети был собран датасет из оцифрованных снимков с различными повреждениями. Для каждого из снимков была вручную создана бинарная маска дефектов.
В качестве функции потерь была использована бинарная кросс-энтропия, так как она позволяет эффективно учитывать дисбаланс классов в задаче сегментации дефектов на фотографиях, где дефектные и не дефектные пиксели представлены неравномерно. Оптимизатором скоростью обучения был выбран Adam.
Нейронная сеть с архитектурой U-Net сошлась на 25 эпохах. Точность модели на тренировочных данных составила 0.9995, потери составили 0.0017, точность на валидационных данных составила 0.9998, потери составили 0,0012.
Результаты работы сети представлены на рисунке 1.
Рисунок 1. Результат работы нейросети. а) оригинальное фото, б) построенная при помощи нейросети бинарная маска
В результате, нейросеть была успешно обучена для решения задачи построения бинарных масок дефектов на основе оцифрованных фотографий. В дальнейшем, полученные на её выходе маски могут быть использованы для последующей обработки и устранения найденных дефектов.
Список литературы:
- Павлов М. А., Муртазина А. Р., Миронов В. П. Восстановление изображения при помощи нейронной сети // Дизайн и технологии. – 2014. – №. 41. – С. 79-86.
- Годунов А. И., Баланян С. Т., Егоров П. С. Сегментация изображений и распознавание объектов на основе технологии сверточных нейронных сетей //Надежность и качество сложных систем. – 2021. – №. 3 (35). – С. 62-73.
- Гаврилов Д. А. Исследование применимости сверточной нейронной сети U-Net к задаче сегментации изображений авиационной техники //Компьютерная оптика. – 2021. – Т. 45. – №. 4. – С. 575-579.
Оставить комментарий