Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)
 МЕЖДУНАРОДНАЯ ЗАОЧНАЯ НАУЧНО-ПРАКТИЧЕСКАЯ КОНФЕРЕНЦИЯ   «ЕСТЕСТВЕННЫЕ И МАТЕМАТИЧЕСКИЕ НАУКИ В СОВРЕМЕННОМ МИРЕ»

Статья опубликована в рамках: XLIII Международной научно-практической конференции «Естественные и математические науки в современном мире» (Россия, г. Новосибирск, 06 июня 2016 г.)

Наука: Информационные технологии

Секция: Системный анализ, управление и обработка информации

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Холод И.И., Мотовилов И.А. ВИЗУАЛИЗАЦИЯ МОДЕЛИ АССОЦИАТИВНЫХ ПРАВИЛ DATA MINING // Естественные и математические науки в современном мире: сб. ст. по матер. XLIII междунар. науч.-практ. конф. № 6(41). – Новосибирск: СибАК, 2016. – С. 52-56.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

ВИЗУАЛИЗАЦИЯ МОДЕЛИ АССОЦИАТИВНЫХ ПРАВИЛ DATA MINING

Холод Иван Иванович

студент Санкт-Петербургского Государственного Электротехнического Университета «ЛЭТИ» им. В.И. Ульянова (Ленина),

РФ, г. Санкт-Петербург

Мотовилов Иван Андреевич

студент Санкт-Петербургского Государственного Электротехнического Университета «ЛЭТИ» им. В.И. Ульянова (Ленина),

РФ, г. Санкт-Петербург

RENDERING MODEL OF ASSOCIATION RULES DATA MINING

Ivan Holod

assistant professor of radio-electronic means, PhD of the St. Petersburg State Electrotechnical University “LETI”,

Russia, Saint Petersburg

Ivan Motovilov

student of the St. Petersburg State Electrotechnical University “LETI”

Russia, Saint Petersburg

 

АННОТАЦИЯ

В статье рассказывается о том, что такое Data Mining, какие задачи он решает. Подробно рассмотрена задача визуализации. Предлагаются варианты визуализации модели ассоциативных правил.

ABSTRACT

This article describes what is Data Mining, what problems it solves. The article details the visualization task. Variants of visualization model of association rules.

 

Ключевые слова: анализ данных, визуализация модели, ассоциативные правила, пользовательский интерфейс.

Keywords: data analysis, visualization models, association rules, user interface.

 

Повсеместное использование вычислительных средств привело к понимаю важности задач, связанных с анализом и извлечением уже накопленных человеком знаний. Так, например, управление предприятием, банком, невозможно без процессов накопления, анализа и прогнозирования.

С каждым годом объем информации, хранящийся в базах знаний, растет. Поэтому очень малая ее часть может когда-либо быть увидена человеческим взором. Здесь на помощь человеку приходят системы поддержки принятия решений [1].

Новые знания, находимые с помощью СППР, представляются в виде моделей, которые трудны в понимании. Здесь на помощь аналитикам приходит визуализация.

Визуализация предоставляет аналитикам конечный результат, позволяет управлять вычислительным процессом. Одним из преимуществ визуализации – отсутствие необходимости в специальных знаниях со стороны пользователя. Понимание информации происходит интуитивно [2].

Термин Data Mining, переводится как добыча данных, извлечение информации – это совокупность методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности.

Data mining основывается на таких науках как прикладная статистика, распознавание образов, искусственный интеллект, теория баз данных [2].

При использовании технологии Data Mining возможно разрешить многие задачи, предъявляемые аналитиками. К таким задачам относятся: классификация, кластеризация, ассоциация, последовательность.

В качестве результата, полученного при решении задачи ассоциации, принято использовать модель ассоциативных правил. В связи с этим при их поиске выделяют два основных этапа:

  • нахождение всех частых наборов объектов;
  • генерация ассоциативных правил из найденных частых наборов объектов.

Ассоциативные правила имеют вид:

если (условие) то (результат)

где условие – не логическое выражение (как это есть в классификационных правилах), а набор объектов, с которыми связаны объекты, включенные в результат данного правила. Пример ассоциативного правила:

если (хлеб, молоко) то (масло)

данное правило означает, что если потребитель покупает хлеб и молоко, то он покупает и масло.

Основным достоинством ассоциативных правил является их легкое понимание восприятие человеком и простая интерпретация языками программирования. Однако, бывают ситуации, когда количество ассоциативных правил велико, к тому же, не все правила несут в себе полезную информацию.

В качестве источника информации для визуализации будет использоваться стандарт PMML.

Ассоциативные правила в стандарте PMML, представляются в виде правил, где один набор элементов (условная часть) ассоциируется с другим набором (заключительная часть).

Визуализация ассоциативных правил должна предоставлять информацию о правилах, которые сформированы между наборами элементов. Также кроме самих правил, должны отображаться сами наборы элементов.

Одним из вариантов визуализации модели ассоциативных правил, является круговая диаграмма (рис. 1).

Каждый узел – это набор элементов. Связи между узлами - правила. Хотя, несмотря на то, что данный вариант визуализации предоставляет понятную информацию о связях (правилах) между наборами, он имеет существенные недостатки:

  • непонятно какой из наборов правил является условием, а какой следствием;
  • низкая масштабируемость – при увеличении количества правил между наборами, происходит увеличение размера диаграммы;
  • отсутствие информации по значениям поддержки и достоверности.

 

Рисунок 1. Представление ассоциативных правил в виде круговой диаграммы

 

Следующим вариантом визуализации модели ассоциативных правил является граф (рис. 2).

 

Рисунок 2. Представление ассоциативных правил в виде графа

 

В данном способе визуализации отображены наборы элементов причин и следствий, представленные в виде узлов графа. Существует возможность просмотра информации по каждому узлу (состав набора элементов). Размер узла определяется значением частоты упоминания набора в других правилах.

Поддержка каждого правила представляется толщиной связи, чем толще связь, тем поддержка выше. Достоверность правила обозначается цветом связи, начиная от красного и заканчивая синим, в зависимости от значения достоверности.

В качестве элементов фильтра выступают значения поддержки и достоверности.

 

Список литературы:

  1. Технологии Анализа данных: Data Mining, Visual Mining, Text Mining, OLAP / А.А. Барсегян, М.С. Куприянов, В.В. Степаненко, И.И. Холод. СПб, 2007. – 384 с.
  2. Чубукова И.А. Data Mining // НОУ ИНТУИТ. URL: www.intuit.ru/studies/courses/6/6/info (Дата обращения: 17.05.2016).
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.