Статья опубликована в рамках: Научного журнала «Студенческий» № 23(151)
Рубрика журнала: Информационные технологии
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3
ВИЗУАЛИЗАЦИЯ МНОГОМЕРНЫХ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ САМООРГАНИЗУЮЩИХСЯ КАРТ
VISUALIZATION OF MULTIDIMENSIONAL DATA USING SELF-ORGANIZING MAPS
Kazbek Mamakev
student, Department of Information Systems in Construction, Don State Technical University,
Russia, Rostov-on-Don
Vladislav Ananenkov
student, Department of Information Systems in Construction, Don State Technical University,
Russia, Rostov-on-Don
АННОТАЦИЯ
В статье приведен способ визуализации многомерных данных с использованием самоорганизующихся карт.
ABSTRACT
The article presents a method for visualizing multidimensional data using self-organizing maps.
Ключевые слова: Самоорганизующиеся карты, карты Кохонена, визуализация многомерных данных.
Keywords: Self-organizing maps, Kohonen maps, multidimensional data visualization.
Введение
Самоорганизующиеся карты (SOM) – это тип нейронной сети, состоящий из одного слоя. Основным ее отличием от нейросетей, обучаемых по алгоритму обратного распространения, является то, что при обучении используется метод обучения без учителя, то есть результат обучения зависит только от структуры входных данных [1].
Алгоритм функционирования самообучающихся карт представляет собой один из вариантов кластеризации многомерных векторов.
При этом в ходе обучения модифицируется не только нейрон-победитель, но и его соседи, но в меньшей степени. За счет этого SOM можно считать одним из методов проецирования многомерного пространства в пространство с более низкой размерностью.
С другой стороны, данный SOM представляет из себя метод квантования векторов, который позволяет анализировать меньше данных, сохраняя при этом ее структур.
Визуализация рукописных цифр
В качестве визуализации были использованы данные о рукописных цифрах. Каждая цифра представляет из себя изображение, то есть двумерный массив размером 8x8 (см. рисунок 1). Иначе говоря, данные состоят из 64-мерных векторов при разложении двумерной сетки.
В данной статье в качестве инструмент для создания карт Кохонена выступает python-пакет MiniSOM – минималистичная и основанная на Numpy реализация самоорганизующихся карт [2].
Рисунок 1. Данные рукописных цифр
Для обучения сети были выбраны следующие параметры:
· Сетка нейронов – 50х50.
· Число признаков – 64.
· Начальное значение распространения функции окрестности – 2,5.
· Скорость обучения – 1,5.
· Количество итераций – 10000.
Ошибка квантизации после обучения составила 2,45.
Теперь с помощью полученной двумерной сетки нейронов, каждая из которых представляет кластер, можно визуализировать цифры в двумерном пространстве. Для этого необходимо выполнить следующие действия: для каждого вектора изображения вычисляется нейрон-победитель, по которому определяется позиция указанного изображения, которая будет отображена в соответствии со своим местоположением в двумерной сетке. Результат работы представлен на рисунке 2.
Рисунок 2. Проекция 64-мерного вектора на двумерной сетке
Из рисунка 2 видно, что цифры представляют собой компактные, плотно сгруппированные кластеры с четко разделяемой границей.
Заключение
В данной статье был рассмотрен один из способов визуализации многомерных данный, а именно с использованием карт Кохонена. Данный способ позволяет более эффективно анализировать данные, представляет данные в удобном виде.
Список литературы:
- Самоорганизующиеся карты Кохонена – математический аппарат. – Текст: электронный // Loginom: [сайт]. – URL: https://loginom.ru/blog/som (дата обращения: 06.06.2021).
- MiniSom. – Текст: электронный // Github: [сайт]. –URL: https://github.com/JustGlowing/minisom (дата обращения: 06.06.2021).
Оставить комментарий