Поздравляем с Новым Годом!
   
Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 21(233)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7, скачать журнал часть 8, скачать журнал часть 9

Библиографическое описание:
Закарин С.С. МЕТОД КОРЕЛЯЦИОННОГО АНАЛИЗА ДЛЯ ПРОГНОЗИРОВАНИЯ ПОТРЕБИТЕЛЬСКОГО ПОВЕДЕНИЯ ПОКУПАТЕЛЯ // Студенческий: электрон. научн. журн. 2023. № 21(233). URL: https://sibac.info/journal/student/233/294037 (дата обращения: 01.01.2025).

МЕТОД КОРЕЛЯЦИОННОГО АНАЛИЗА ДЛЯ ПРОГНОЗИРОВАНИЯ ПОТРЕБИТЕЛЬСКОГО ПОВЕДЕНИЯ ПОКУПАТЕЛЯ

Закарин Саламат Саматович

студент, кафедра компьютерная и программная инженерия, университет Туран,

РК, г. Алматы

Киселева Ольга Владимировна

научный руководитель,

доктор PhD, ассоциированный профессор кафедры  компьютерная и программная инженерия, университет Туран,

РК, г. Алматы

RESEARCH OF CONSUMER BEHAVIOR OF A PASSENGER CAR BUYER AND DEVELOPMENT OF AN AUTOMATED SYSTEM BASED ON HIS PREFERENCES

 

Salamat Zakarin

Student, Department of Computer and Software Engineering, Turan University,

RK, Almaty

Olga Kiseleva

scientific supervisor, PhD, Associate Professor of the Department of Computer and Software Engineering, Turan University,

RK, Almaty

 

АННОТАЦИЯ

Потребительское поведение является ключевым аспектом успешной маркетинговой стратегии для производителей и продавцов легковых автомобилей. В данной статье проводится исследование потребительского поведения покупателей легковых автомобилей и разрабатывается автоматизированная система, основанная на их предпочтениях. Целью исследования является понимание факторов, влияющих на выбор автомобиля покупателями, а также разработка системы, которая может предложить рекомендации на основе этих предпочтений.

ABSTRACT

Consumer behavior is a key aspect of a successful marketing strategy for manufacturers and sellers of passenger cars. This article examines the consumer behavior of car buyers and develops an automated system based on their preferences. The aim of the study is to understand the factors influencing the choice of a car by buyers, as well as to develop a system that can offer recommendations based on these preferences.

 

Ключевые слова: потребительское поведение, покупатель, легковой автомобиль, исследование, предпочтения, автоматизированная система, маркетинговая стратегия, данные, рекомендации, машинное обучение, дерево принятия решений, метод опорных векторов, марка, модель, год выпуска, точка продажи, стоимость автомобиля, годовой налог, удовлетворенность клиента, анализ данных, история обслуживания, отзывы покупателей, торговля.

Keywords: consumer behavior, buyer, passenger car, research, preferences, automated system, marketing strategy, data, recommendations, machine learning, decision tree, support vector method, make, model, year of manufacture, point of sale, car cost, annual tax, customer satisfaction, data analysis, service history, customer reviews, trade.

 

Введение

В настоящее время автомобильная промышленность сталкивается с множеством проблем, начиная от быстрой цифровизации и заканчивая нехваткой запасов. Успех автодилеров все еще зависит от их способности адаптироваться и принимать изменения. Изменения затрагивают не только ожидания и покупательские привычки, но и способы продажи, поскольку клиенты все чаще предпочитают цифровую розничную торговлю и интернет-торговцев. Также меняется то, что потребители приобретают, влияя на доступность запасов, государственное регулирование и ассортимент товаров от производителей OEM и других производителей.

Автомобильная промышленность в Казахстане относится к приоритетным отраслям согласно Государственной программе индустриально-инновационного развития на 2015-2019 годы. В настоящее время 60% продаваемых в стране автомобилей производятся в Казахстане.

С учетом множества факторов, влияющих не только на способность дилерских центров продавать новые автомобили, но и на их продвижение, крайне важно, чтобы дилеры обращались к данным, чтобы лучше понимать изменяющуюся ситуацию на рынке автомобильной розничной торговли и покупательское поведение клиентов.

В данной магистерской диссертации исследуются текущие рыночные тенденции, которые оказывают влияние на покупательское поведение автомобилей. Эти тенденции должны быть учтены дилерами при планировании своей деятельности в будущем.

Целью исследования является разработка автоматизированной системы для анализа потребительского поведения покупателей легковых автомобилей на основе эффективных методов и технологий. Исследуется метод анализа и прогнозирования потребительского поведения, а также проблемы, с которыми сталкиваются автоматизированные системы потребительского поведения. Задачи исследования включают описание состояния и проблем существующих систем, анализ методов прогнозирования и анализа потребительского поведения, а также разработку системы для прогнозирования потребительского поведения покупателей.

Обоснование и применение методики корреляционного анализа для прогнозирования потребительского поведения покупателя

Корреляционный анализ вычисляет связь между двумя переменными или метриками, позволяя определить степень изменения одной переменной при изменении другой. Когда существует сильная корреляция между двумя переменными и одна из них проявляет определенное поведение, можно сделать вывод, что другая переменная также подвержена подобному воздействию. Это позволяет выявить общую связь и основную причину явлений, которые на первый взгляд могут казаться нерелевантными и непонятными.

Корреляционный анализ помогает выявить значимые связи между различными показателями или группами показателей, даже если они происходят из разных частей бизнеса. Он позволяет группировать связанные метрики вместе, уменьшая необходимость в индивидуальной обработке данных. Высокая корреляция указывает на сильную связь между метриками, в то время как низкая корреляция указывает на их слабую связь. Положительная корреляция означает, что обе метрики увеличиваются вместе, а отрицательная корреляция показывает, что одна метрика увеличивается, а другая уменьшается.

В маркетинге корреляционный анализ используется для оценки эффективности кампаний путем отслеживания и тестирования реакции клиентов на различные маркетинговые тактики. Это позволяет маркетологам лучше понимать и обслуживать своих клиентов, исходя из выявленных связей и взаимосвязей.

В целом, корреляционный анализ является мощным инструментом для выявления связей и понимания взаимодействий между переменными или метриками. Он помогает компаниям принимать информированные решения, оптимизировать свои стратегии и улучшать обслуживание клиентов на основе полученных результатов анализа.

Преимущества корреляционного анализа

Для аналитиков данных и специалистов по мониторингу данных корреляционный анализ является чрезвычайно полезным инструментом при анализе основных причин и сокращении времени до обнаружения (TTD) и времени до устранения (TTR). Обнаружение двух необычных событий или аномалий, происходящих одновременно или с одинаковой частотой, может помочь определить корень проблемы. Если проблему можно понять и исправить раньше, то организация сэкономит на затратах по ее устранению.

Группы технической поддержки могут сократить количество уведомлений, на которые им необходимо реагировать, путем фильтрации несущественных аномалий и объединения коррелирующих аномалий в одно уведомление. Инструменты, такие как системы безопасности информации и управления событиями (SIEM), автоматически выполняют эту задачу, что упрощает реагирование на инциденты.

Корреляционный анализ также предоставляет естественную возможность определить факторы, оказывающие ключевое влияние на увеличение продаж. Способность определить сильные корреляции позволяет маркетологам эффективнее планировать рекламные кампании.

Обнаружение взаимосвязей между показателями данных имеет множество практических применений в мониторинге бизнеса. Корреляционный анализ помогает выявить первопричину проблемы и существенно сократить время ее устранения. Он также позволяет группировать события вместе, что приводит к уменьшению количества уведомлений, снижению утомления персонала службы поддержки и экономии затрат на расследование повторяющихся уведомлений.

Типы корреляционного анализа в интеллектуальном анализе данных

Корреляция — это двуфакторный анализ, который измеряет силу связи между двумя переменными и направление связи. По силе связи значение коэффициента корреляции колеблется от +1 до -1. Значение ± 1 указывает на идеальную степень связи между двумя переменными. По мере приближения значения коэффициента корреляции к 0 связь между двумя переменными будет слабее. Направление связи указывается знаком коэффициента; знак + указывает на положительную связь, а знак - указывает на отрицательную связь.

Существует несколько методов расчета корреляции.

Обычно в статистике измеряются четыре типа корреляций:

- корреляцию Пирсона;

- ранговую корреляцию Кендалла;

- корреляцию Спирмена;

- двухрядную корреляцию.

Наиболее распространенный метод, корреляция продукта и момента Пирсона.

Корреляция Пирсона r

Корреляция Пирсона представляет собой наиболее распространенную статистическую меру взаимосвязи между линейно зависимыми переменными [18].

Значение коэффициента корреляции Пирсона может варьироваться от +1 до -1. Значение +1 указывает на положительную линейную связь между переменными, -1 указывает на отрицательную линейную связь, а значение 0 указывает на отсутствие линейной связи.

Другими словами, положительное значение коэффициента указывает на то, что переменные имеют положительную корреляцию, и при увеличении одной переменной другая тоже увеличивается, а при уменьшении одной переменной другая тоже уменьшается. С другой стороны, отрицательное значение коэффициента указывает на отрицательную корреляцию, и при увеличении одной переменной другая уменьшается, и наоборот.

Коэффициент корреляции не только указывает на наличие или отсутствие взаимосвязи между переменными, но и определяет точную степень этой связи.

Коэффициент корреляции между переменными является симметричным, что означает, что значение коэффициента корреляции между Y и X или между X и Y будет одинаковым.

Например, на фондовом рынке, если нужно измерить, как две акции взаимосвязаны друг с другом, используется корреляция Пирсона для оценки степени этой взаимосвязи. Парный коэффициент корреляции также может быть рассчитан для случая, когда одна переменная является бинарной. Для расчета коэффициента корреляции Пирсона r используется следующая формула:

где   = коэффициент корреляции Пирсона r между x и y

n = количество наблюдений

 = значение x (для i-го наблюдения)

 = значение y (для i-го наблюдения)

Используя этот метод, можно установить направление корреляции, т. е. является ли корреляция между двумя переменными отрицательной или положительной.

Ограничения: Коэффициента корреляции Пирсона R недостаточно, чтобы определить разницу между зависимой и независимой переменными, поскольку коэффициент корреляции между переменными симметричен. Например, если человек пытается узнать корреляцию между высоким уровнем стресса и кровяным давлением, он может обнаружить высокое значение корреляции, которое показывает, что высокий уровень стресса вызывает кровяное давление. Теперь, если переменная поменяется местами, то результат в этом случае тоже будет тот же, что показывает, что стресс возникает из-за кровяного давления, что не имеет смысла. Таким образом, исследователь должен знать, какие данные он использует для анализа [19].

Используя этот метод, нельзя получить информацию о наклоне линии, поскольку он только указывает, существует ли какая-либо связь между двумя переменными или нет. Коэффициент корреляции Пирсона, вероятно, может быть неверно истолкован, особенно в случае однородных данных.

По сравнению с другими методами расчета этот метод требует много времени для получения результатов.

Алгоритм с использованием корреляции Пирсона

На рисунке ниже приведен алгоритм с использованием корреляции Пирсона.

 

Рисунок 1. Алгоритм с использованием корреляции Пирсона

 

Рассмотрим пример определения цены автомобиля, где мы должны определить цену, учитывая все переменные, влияющие на цену автомобиля, такие как длина автомобиля, снаряженная масса, высота автомобиля, ширина автомобиля, тип топлива, кузов, мощность и т. д.

Корреляцию между непрерывными переменными можно найти с помощью python:

 

Рисунок 2. Поиск корреляции с помощью python

 

Рисунок 3. Диаграмма рассеяния

 

Из представленной выше диаграммы рассеяния можно наблюдать, что с увеличением длины, снаряженного веса и ширины автомобиля, также увеличивается его цена. Это говорит о наличии положительной корреляции между этими тремя переменными и ценой автомобиля. Однако отмечается отсутствие корреляции между высотой автомобиля и его ценой.

Автомобили с более высокими ценами имеют значительно меньший пробег по сравнению с автомобилями ниже ценового диапазона. Таким образом, можно сделать вывод о наличии отрицательной корреляции между ценой автомобиля и его пробегом.

 

Рисунок 4. Корреляция между ценой автомобиля и пробегом

 

Ранговая корреляция Кендалла, также известная как коэффициент Тау Кендалла, является статистическим методом для измерения силы связи между двумя переменными, который не требует определенных предположений о данных.

Кендаллова ранговая корреляция является альтернативой параметрической корреляции Пирсона, применяемой в случае, когда данные не удовлетворяют условиям применения Пирсона, а также предпочтительнее непараметрической корреляции Спирмена при небольших выборках с большим количеством связанных рангов.

Этот метод используется для определения подобия в упорядочении данных при их ранжировании. В отличие от других видов корреляции, основанных на наблюдениях, Кендаллов коэффициент корреляции использует пары наблюдений и оценивает силу связи на основе согласованности и несогласованности между парами.

Конкордантные пары находятся в одинаковом порядке по обеим переменным, в то время как дисконкордантные пары имеют противоположное расположение.

Тау-коэффициент корреляции Кендалла обычно имеет меньшие значения, чем коэффициент корреляции Спирмена. Он основан на конкордантных и дисконкордантных парах и нечувствителен к выбросам. Значения P более точно оцениваются при малых выборках.

Кендаллова ранговая корреляция предполагает монотонные отношения между переменными, что означает, что при увеличении значения одной переменной значение другой переменной также увеличивается или уменьшается. Поэтому этот метод применяется для определения наличия монотонной зависимости между переменными.

 

Рисунок 5. Корреляция Пирсона для цены и веса

 

Но если построить график зависимости суммы кредита от возраста, из этого невозможно сделать какой-либо вывод. Это нарушило бы предположение.

Заключение

Исследование потребительского поведения покупателей легковых автомобилей и разработка автоматизированной системы на основе их предпочтений является важной задачей для производителей и продавцов автомобилей. Понимание факторов, влияющих на выбор автомобиля, позволяет улучшить маркетинговые стратегии и предлагать наиболее подходящие автомобили покупателям. Автоматизированная система предоставляет удобный инструмент для предоставления рекомендаций и повышения уровня удовлетворенности покупателей.

В дальнейшем исследование может быть расширено для включения дополнительных факторов и данных, таких как история обслуживания автомобиля или отзывы покупателей. Это поможет более точно определить предпочтения покупателей и улучшить рекомендации системы. Также стоит отметить, что разработанная система может быть адаптирована для других отраслей и типов товаров, где потребительское поведение имеет важное значение.

В заключении, исследование потребительского поведения покупателей легковых автомобилей и разработка автоматизированной системы на основе их предпочтений играет важную роль в современной торговле. Это позволяет производителям и продавцам легковых автомобилей лучше понять своих клиентов и предложить оптимальные решения, отвечающие их потребностям и предпочтениям.

 

Список литературы:

  1. Solomon, M. R. (2017). Consumer Behavior: Buying, Having, and Being. Pearson.
  2. Kotler, P., Keller, K. L., Brady, M., Goodman, M., & Hansen, T. (2019). Marketing Management. Pearson.
  3. Schiffman, L. G., & Kanuk, L. L. (2013). Consumer Behavior. Pearson.
  4. Hair Jr, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2019). Multivariate Data Analysis. Cengage Learning.
  5. Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
  6. Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and Regression Trees. CRC press.
  7. Choudhury, T., Bhattacharya, S., & Mondal, A. (2017). A Hybrid Approach for Car Recommendation Using Decision Tree and Artificial Neural Network. International Journal of Intelligent Systems and Applications, 9(4), 41-49.
  8. Belanche, D., Flavián, C., & Pérez-Rueda, A. (2019). The Role of Website Quality on User Satisfaction: Examining the Effects of a Website Recommendation System. Information & Management, 56(1), 103-118.
  9. Babin, B. J., Darden, W. R., & Griffin, M. (1994). Work and/or Fun: Measuring Hedonic and Utilitarian Shopping Value. Journal of Consumer Research, 20(4), 644-656.
  10. Ratchford, B. T. (1987). New Insights About the FCB Grid. Journal of Advertising Research, 27(6), 24-40.

Оставить комментарий