Статья опубликована в рамках: XLIII Международной научно-практической конференции «Естественные и математические науки в современном мире» (Россия, г. Новосибирск, 06 июня 2016 г.)
Наука: Информационные технологии
Секция: Системный анализ, управление и обработка информации
Скачать книгу(-и): Сборник статей конференции
дипломов
ВИЗУАЛИЗАЦИЯ МОДЕЛИ АССОЦИАТИВНЫХ ПРАВИЛ DATA MINING
RENDERING MODEL OF ASSOCIATION RULES DATA MINING
Ivan Holod
assistant professor of radio-electronic means, PhD of the St. Petersburg State Electrotechnical University “LETI”,
Russia, Saint Petersburg
Ivan Motovilov
student of the St. Petersburg State Electrotechnical University “LETI”
Russia, Saint Petersburg
АННОТАЦИЯ
В статье рассказывается о том, что такое Data Mining, какие задачи он решает. Подробно рассмотрена задача визуализации. Предлагаются варианты визуализации модели ассоциативных правил.
ABSTRACT
This article describes what is Data Mining, what problems it solves. The article details the visualization task. Variants of visualization model of association rules.
Ключевые слова: анализ данных, визуализация модели, ассоциативные правила, пользовательский интерфейс.
Keywords: data analysis, visualization models, association rules, user interface.
Повсеместное использование вычислительных средств привело к понимаю важности задач, связанных с анализом и извлечением уже накопленных человеком знаний. Так, например, управление предприятием, банком, невозможно без процессов накопления, анализа и прогнозирования.
С каждым годом объем информации, хранящийся в базах знаний, растет. Поэтому очень малая ее часть может когда-либо быть увидена человеческим взором. Здесь на помощь человеку приходят системы поддержки принятия решений [1].
Новые знания, находимые с помощью СППР, представляются в виде моделей, которые трудны в понимании. Здесь на помощь аналитикам приходит визуализация.
Визуализация предоставляет аналитикам конечный результат, позволяет управлять вычислительным процессом. Одним из преимуществ визуализации – отсутствие необходимости в специальных знаниях со стороны пользователя. Понимание информации происходит интуитивно [2].
Термин Data Mining, переводится как добыча данных, извлечение информации – это совокупность методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.
Data mining основывается на таких науках как прикладная статистика, распознавание образов, искусственный интеллект, теория баз данных [2].
При использовании технологии Data Mining возможно разрешить многие задачи, предъявляемые аналитиками. К таким задачам относятся: классификация, кластеризация, ассоциация, последовательность.
В качестве результата, полученного при решении задачи ассоциации, принято использовать модель ассоциативных правил. В связи с этим при их поиске выделяют два основных этапа:
- нахождение всех частых наборов объектов;
- генерация ассоциативных правил из найденных частых наборов объектов.
Ассоциативные правила имеют вид:
если (условие) то (результат)
где условие – не логическое выражение (как это есть в классификационных правилах), а набор объектов, с которыми связаны объекты, включенные в результат данного правила. Пример ассоциативного правила:
если (хлеб, молоко) то (масло)
данное правило означает, что если потребитель покупает хлеб и молоко, то он покупает и масло.
Основным достоинством ассоциативных правил является их легкое понимание восприятие человеком и простая интерпретация языками программирования. Однако, бывают ситуации, когда количество ассоциативных правил велико, к тому же, не все правила несут в себе полезную информацию.
В качестве источника информации для визуализации будет использоваться стандарт PMML.
Ассоциативные правила в стандарте PMML, представляются в виде правил, где один набор элементов (условная часть) ассоциируется с другим набором (заключительная часть).
Визуализация ассоциативных правил должна предоставлять информацию о правилах, которые сформированы между наборами элементов. Также кроме самих правил, должны отображаться сами наборы элементов.
Одним из вариантов визуализации модели ассоциативных правил, является круговая диаграмма (рис. 1).
Каждый узел – это набор элементов. Связи между узлами - правила. Хотя, несмотря на то, что данный вариант визуализации предоставляет понятную информацию о связях (правилах) между наборами, он имеет существенные недостатки:
- непонятно какой из наборов правил является условием, а какой следствием;
- низкая масштабируемость – при увеличении количества правил между наборами, происходит увеличение размера диаграммы;
- отсутствие информации по значениям поддержки и достоверности.
Рисунок 1. Представление ассоциативных правил в виде круговой диаграммы
Следующим вариантом визуализации модели ассоциативных правил является граф (рис. 2).
Рисунок 2. Представление ассоциативных правил в виде графа
В данном способе визуализации отображены наборы элементов причин и следствий, представленные в виде узлов графа. Существует возможность просмотра информации по каждому узлу (состав набора элементов). Размер узла определяется значением частоты упоминания набора в других правилах.
Поддержка каждого правила представляется толщиной связи, чем толще связь, тем поддержка выше. Достоверность правила обозначается цветом связи, начиная от красного и заканчивая синим, в зависимости от значения достоверности.
В качестве элементов фильтра выступают значения поддержки и достоверности.
Список литературы:
- Технологии Анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. СПб, 2007. – 384 с.
- Чубукова И.А. Data Mining // НОУ ИНТУИТ. URL: www.intuit.ru/studies/courses/6/6/info (Дата обращения: 17.05.2016).
дипломов
Оставить комментарий