Статья опубликована в рамках: XCII Международной научно-практической конференции «Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ» (Россия, г. Новосибирск, 07 мая 2020 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:

Шкиря А.С. РАЗРАБОТКА ГЕНЕРАТИВНО-СОСТЯЗАТЕЛЬНОЙ СЕТИ ДЛЯ СОЗДАНИЯ ИЗОБРАЖЕНИЙ // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. XCII междунар. студ. науч.-практ. конф. № 9(92). URL: https://sibac.info/archive/meghdis/9(92).pdf (дата обращения: 02.07.2025)

Проголосовать за статью

Конференция завершена

Эта статья набрала 1 голос

Дипломы участников

У данной статьи нет
дипломов

РАЗРАБОТКА ГЕНЕРАТИВНО-СОСТЯЗАТЕЛЬНОЙ СЕТИ ДЛЯ СОЗДАНИЯ ИЗОБРАЖЕНИЙ

Шкиря Анна Сергеевна

магистрант, Инженерная школа информационных технологий и робототехники, Национальный исследовательский Томский политехнический университет,

РФ, г. Томск

DEVELOPMENT OF A GENERATIVE ADVERSARIAL NETWORK FOR CREATING IMAGES

Anna Shkirya

master, School of Computer Science & Robotics, National Research Tomsk Polytechnic University,

Russia, Tomsk

АННОТАЦИЯ

Целью настоящего исследования являлась разработка генеративно-состязательной сети для создания изображений. Был использован алгоритм машинного обучения без учителя, построенный на комбинации из двух нейронных сетей, одна из которых генерирует образцы, а другая старается отличить правильные («подлинные») образцы от неверных. Итогом работы стала сеть, способная генерировать изображения с цифрами.

ABSTRACT

The current research was aimed to develop a generative adversarial network for image creation using the machine-learning algorithm without a teacher. The algorithm represented a combination of two neural networks: one for pattern generation and the other for distinguishing between correct (“genuine”) and incorrect patterns. The result of the research constituted the network that can generate images including numbers.

Ключевые слова: нейронные сети, свёрточная сеть, генератор, дискриминатор, генерация изображения.

Keywords: neural networks, convolutional network, generator, discriminator, image generation.

Введение

Анализ данных осуществляется с применением ИНС (искусственных нейронных сетей), позволяющих реализовывать задачи на прогнозирование, оптимизацию, распознавания образов и других. Нейронные сети обладают большими возможностями, в свою очередь они просты и применимы для различных задач: распознавание или улучшение качества изображения, поиск результатов по фотографии, распознавание речи. Все это применимо на основе свёрточной нейронной сети. Происходит это за счёт чередования слоёв подвыборки и свёрточных. Свертка заключается в умножении фрагмента картинки или фотографии на ядро свертки поэлементно, на выходе записывается просуммированная позиция выходной фотографии.

Обзор литературы

Все нейронные сети можно разделить на два больших класса: сети прямого распространения и сети с обратной связью. Особенностью первого класса является линейная обработка сигнала каждым отдельным слоем, передавая выход на следующий слой нейронов, такие сети лучше использовать для сегментации, составления прогнозов и распознавания образов.

Полносвязные НС (нейронные сети) имеют связи между текущем и предыдущем слоем: на входе – вектор, получающий информацию. Выходной слой – выдает результат. Такой тип НС довольно прост, но сеть не способна распознавать образы при разных расположениях входного вектора, второй фактор в зависимости от количества слоев, если их менее трех, классификация нелинейно разделимых объектов не будет выполнимой [2, c. 870]

Материалы и методы исследования

Входные данные должны удовлетворять критерию репрезентативности – соответствию выборки характеристикам генеральной совокупности. В качестве входных данных выбрана база данных MNIST (Mixed National Institute of Standarts and Technology), которая содержит 60 000 изображений 28*28 рукописных символов в обучающей выборке и 10 000 в тестовой выборке с 1 цветовым каналом.

Если входное значение является изображением, то оно представляется в виде двухмерной матрицы, что позволяет сохранить информацию о соседних точках. Выходом свёрточного слоя являются карты признаков, элементы которых получаются в результате скалярного произведения фильтра с участком входного слоя размером с сам фильтр. Каждый фильтр выдает одну карту признаков [1, c. 347].

Гиперапараметрами в свёрточной сети будут:

размер фильтра (stride) в свёрточном слое;
шаг, с которым перемещается фильтр во входном изображении;
шаг усреднения в слое субдискретизации;
число свёрточных слоев.

В работе рассматривалась архитектура следующих нейронных сетей:

Рисунок 1. Схема сети (1 – генератора, 2 - дискриминатора)

Модели сети, топологии которых приведены на рисунке 2 и 3:

Рисунок 2. Описание использованных моделей для генератора

Рисунок 3. Описание использованных моделей для дискриминатора

Параметры каждой из моделей подбирались экспериментальным путем для достижения максимально возможных результатов. Для предотвращения переобучения классификаторов использовалась регуляризация, а для автокодировщиков использовалась ранняя остановка обучения.

Таким образом, у GAN есть двойной цикл обратной связи:

Дискриминатор находится в цикле с изображениями из исходного датасета.
Генератор находится в цикле с дискриминатором, получая от него обратную связь, насколько удачно он создал новый экземпляр датасета.

Результаты

Идеальной генерации изображения с цифрой не достигнута, но в каждом изображении есть приближенная, к реальному виду, цифра из набора данных. Определим точность для каждого изображения. Точность первого изображения c цифрой «0» = 64%, точность второго изображения c цифрой «5» = 80%, точность второго изображения c цифрой «4» = 62%, точность второго изображения c цифрой «3» = 56%.

Средняя точность генерации изображения цифры равна 65,5%.

Рисунок 4. Результат генерации изображения

Заключение

В процессе исследования был проведен анализ алгоритмов классификации, выбран наиболее походящий алгоритм на основе нейронных сетей, исследованы алгоритмы обучения и виды функции активации нейронов, отобраны наиболее подходящие для реализуемой архитектуры нейронной сети.

Согласно поставленной цели, разработана генеративно-состязательная сеть, для генерации изображений с цифрами.

Список литературы:

Шолле Франсуа «Глубокое обучение на Python» // Издательский дом ""Питер"" – 2018, С. 400
Asit Kumar Das, Janmenjoy Nayak. Computational Intelligence in Pattern Recognition // Proceedings of CIPR 2019 – Springer – 2019, Р. 1046.
S. Ren, K. He, R. Girshick, and J. Sun, «Faster R-CNN: Towards 14 real-time object detection with region proposal networks» in Neural Information Processing Systems (NIPS) – 2015