Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: LXXVIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 10 июня 2019 г.)

Наука: Информационные технологии

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Наумова Е.А. ПРИМЕНЕНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ СЕГМЕНТАЦИИ КЛИЕНТСКОЙ БАЗЫ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. LXXVIII междунар. студ. науч.-практ. конф. № 6(77). URL: https://sibac.info/archive/technic/6(77).pdf (дата обращения: 20.04.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 1 голос
Дипломы участников
У данной статьи нет
дипломов

ПРИМЕНЕНИЕ МЕТОДОВ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ ДЛЯ СЕГМЕНТАЦИИ КЛИЕНТСКОЙ БАЗЫ

Наумова Евгения Александровна

студент ВлГУ, кафедра ВТиСУ,

РФ, г. Владимир

Карповский Владимир Александрович

научный руководитель,

канд. техн. наук, доцент ВлГУ,

РФ, г. Владимир

APPLICATION OF THE METHODS OF INTELLECTUAL DATA ANALYSIS FOR SEGMENTATION OF THE CLIENT BASE

 

Naumova Evgeniya Aleksandrovna

Student VlSU, Department of computer engineering and control systems,

Russia, city of Vladimir

Karpovskiy Vladimir Aleksanrovich

Candidate of Science, Department of computer engineering and control systems,

Russia, city of Vladimir

 

Аннотация. В статье рассматривается практическое применение метода интеллектуального анализа данных «Карта Кохонена» для сегментации клиентской базы на основе данных анкетирования.  Для иллюстрации приведены скриншоты результатов обработки анкетных данных с помощью данного метода в аналитической платформе Deductor Studio.

Abstract. The article discusses the practical application of the Kohonen Map data mining method for segmentation of the client base on the basis of survey data. Screenshots of the results of the processing of personal data using this method in the analytical platform Deductor Studio are provided for illustration.

 

Ключевые слова: анкетирование, интеллектуальный анализ данных, сегментация клиентской базы, Карта Кохонена, маркетинг, аналитическая платформа, нейронная сеть, кластеры, методы Data-Mining, поиск скрытых зависимостей.

Keywords: survey, data mining, customer base segmentation, Kohonen map, marketing, analytical platform, neural network, clusters, Data-Mining methods, search for hidden dependencies.

 

Одним из самых распространённых способов получения информации о субъективных оценках потребителей и их поведении является анкетирование.  Часто компании недооценивают важность получаемой информации и возможности ее применения для бизнеса в силу отсутствия возможности увидеть в ней скрытые закономерности. Использование методов интеллектуального анализа данных может стать решением проблему поиска скрытых зависимостей для принятия стратегических решений [1]. Для любого успешного предприятия важнейшим фактором успеха является наличие постоянной клиентской базы. Для правильного использования информации о постоянных и случайных посетителях требуется провести сегментацию клиентуры для дальнейшего выявления целевой аудитории и принятия стратегических решений.

В данной статье будет рассмотрен процесс сегментации клиентской базы на основе заполненных анкетных данных посетителей гостиницы в аналитической платформе Deductor Studio.  Такой метод интеллектуального анализа данных как карта Кохонена входит в группу методов Data-Mining, основное назначение которых – поиск нетривиальных скрытых закономерностей для практического применения этих знаний. Ответы респондентов образуют набор для обучения. Требуется произвести настройку обработчика «Карта Кохонена». В качестве выходного параметра указывается «Желание повторного бронирования» для применения к решению задачи прогнозирования. Таким образом после обработки входного набора данных получается следующая карта Кохонена (рис.1) [2].

 

Рисунок 1. Карта Кохонена

 

Интерпретировать результаты можно применяя также визуализатор «Профили кластеров», где выводится каждый атрибут и распределение этого атрибута в каждом кластере. Самым крупным является кластер, выделенный зелёным. 30 % респондентов отнесены к данному кластеру. В него входят женщины среднего возраста (30-40 лет), подавляющее большинство которых имеют высшее образование и средним уровнем дохода. Чаще всего это туристы, которые бронируют номер по телефону. Источником информации является интернет. Цена – основной критерий выбора отеля. Положительные оценки выставляли 80 % опрошенных.

Ко второму кластеру относятся 25,7 % респондентов (синий цвет). Это мужчины среднего возраста (30-40 лет) с высшим образованием и дохами выше среднего. Бронируют номер через сайт гостиницы и чуть реже Booking, узнавая об отеле. Чаще всего мужчины приезжают в туристических целях, реже останавливаются в командировке, или же в частных и учебных целях. Выделяют цену основным критерием для выбора. Положительные оценки впечатления от гостиницы выставляют 60 % из них.

Кластер, выделенный голубым почти такой же по величине как предыдущий, представлен мужчинами среднего возраста. Их доходы ниже среднего и средние, а образование – среднее (иногда начальное). Чаще всего приезжают в командировочных или туристических целях и ищут информацию о гостинице в поисковой системе или на сайте. Бронирование производят через сайт или по телефону. Почти всегда дают положительные оценки общему впечатлению от оказанных услуг, только в 17 % случаев ставят оценку «3».

Последний кластер образуют 20 % респондентов. В него входят женщины со средним образованием. Возраст колеблется от юного до зрелого, а доходы – средние и выше среднего. Бронь осуществляют по телефону или через сайт-посредник. Для выбора гостиницы используют в качестве критерия цену в 42 % случаев, чуть реже удобства и отзывы. Чаще всего указывают туристические цели пребывания, реже преследуют командировочные или учебные цели. Почти всегда довольны оказанными услугами.

Кроме того, можно проанализировать такой визуализатор как «Что-Если», где при подаче изменении значений входных полей данных получить ответ на вопрос о том, каким скорее всего окажется выходной параметр при заданных входах (рис. 2).

 

Рисунок 2. Визуализатор «Что если»

 

Кроме всего прочего доступным для анализа еще до обработки с помощью «карты Кохонена» является «Статистика» или визуализированные в удобном виде статистические характеристики конкретного узла набора данных. Характеристики общего впечатления говорят о низкой лояльности клиентов наряду с отрицательными ответами на вопрос о желании повторного бронирования номеров в рассматриваемом объекте размещения (рис.3).

 

 

Рисунок 3. Статистические данные о низкой лояльности

 

Для представления информации понятной для обычного пользователя форме требуется составить Olap-куб с переименованными кластерами (рис.4).

 

Рисунок 4. Olap-куб повторной оценки впечатления гостей

 

Все остальные визуализаторы аналитик может вынести во вкладку «Отчёты», чтобы скрыть подробности сценария обработки и затем использовать на рабочем месте пользователя в приложении Deductor Viewer.[3]

Таким образом, в данной статье были описаны и проиллюстрированы результаты сегментации клиентской базы на основе анкетных данных с применением методов интеллектуального анализа данных в аналитической платформе Deductor Studio, которые можно использовать для принятия оперативных и стратегических решений в гостинице.

 

Список литературы:

  1. Дюк В. А. Data Mining: Учебный курс. СПб.: Питер 2010.
  2. Deductor Руководство аналитика [Электронный ресурс]. – Режим доступа: https://basegroup.ru/system/files/documentation/guide_analyst_5.3.0.pdf. (Дата обращения: 02.02.2019)
  3. Deductor Viewer [Электронный ресурс]. – Режим доступа: https://basegroup.ru/deductor/components/viewer/. (Дата обращения: 02.02.2019)
Проголосовать за статью
Конференция завершена
Эта статья набрала 1 голос
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.