Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: Научного журнала «Студенческий» № 24(320)

Рубрика журнала: Информационные технологии

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5

Библиографическое описание:
Зверева У.А. ПРИМЕНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ И АНАЛИТИЧЕСКИХ МЕТОДОВ PYTHON ПРИ ИССЛЕДОВАНИИ ГЕНЕРАЦИОННЫХ РАЗЛИЧИЙ // Студенческий: электрон. научн. журн. 2025. № 24(320). URL: https://sibac.info/journal/student/320/382079 (дата обращения: 03.08.2025).

ПРИМЕНЕНИЕ НЕПАРАМЕТРИЧЕСКИХ И АНАЛИТИЧЕСКИХ МЕТОДОВ PYTHON ПРИ ИССЛЕДОВАНИИ ГЕНЕРАЦИОННЫХ РАЗЛИЧИЙ

Зверева Ульяна Андреевна

студент, факультет управления, Санкт-Петербургский государственный экономический университет,

РФ, г. Санкт-Петербург

Попазова Ольга Анатольевна

научный руководитель,

канд. экон. наук, доц., Санкт-Петербургский государственный экономический университет,

РФ, г. Санкт-Петербург

APPLICATION OF NON-PARAMETRIC AND ANALYTICAL PYTHON METHODS IN THE STUDY OF GENERATIONAL DIFFERENCES

 

Ulyana Zvereva

student, Faculty of Management, St. Petersburg State University of Economics,

Russia, St. Petersburg

Olga Popazova

scientific supervisor, candidate of Sciences in Economics, associate professor, St. Petersburg State University of Economics,

Russia, St. Petersburg

 

АННОТАЦИЯ

Целью исследования является выявление статистически значимых различий в оценке условий труда представителями различных поколений с использованием непараметрических тестов и аналитических инструментов Python. На основе результатов анкетирования 156 работников была проведена комплексная обработка данных. Обработка осуществлялась в Python с использованием библиотек pandas, numpy, scipy, sklearn. Результаты подтвердили наличие поколенческих различий по ряду критериев.

ABSTRACT

The purpose of this study is to identify statistically significant differences in the assessment of working conditions by representatives of different generations using non-parametric tests and Python analytical tools. Based on the results of a survey of 156 employees, comprehensive data processing was carried out. The processing was performed in Python using the pandas, numpy, scipy, and sklearn libraries. The results confirmed the presence of generational differences across several criteria.

 

Ключевые слова: Python, Kruskal–Wallis, теория поколений, eNPS, HR-аналитика, непараметрические методы.

Keywords: Python, Kruskal–Wallis, generational theory, eNPS, HR analytics, nonparametric methods.

 

Введение

Современные условия труда характеризуются высокой степенью демографической неоднородности: на одном предприятии могут одновременно работать представители до четырёх-пяти различных поколений. Теория поколений как инструмент социального анализа позволяет выделить группы работников, сформировавшиеся под влиянием различного исторического, культурного и технологического контекста. Это влияет на их отношение к труду, ожидания от работодателя и субъективную удовлетворённость условиями работы. В связи с этим актуализируется задача изучения генерационных различий в контексте трудовой деятельности.

При этом важно применять инструменты статистического анализа, способные корректно обрабатывать социологические данные, собранные в шкальном или порядковом формате, часто не соответствующем нормальному распределению. Использование Python как аналитической платформы предоставляет широкие возможности для реализации таких задач, включая проведение непараметрических тестов, построение моделей и визуализацию данных.

Методология исследования

Исследование основано на данных анкетирования 156 сотрудников промышленного предприятия. Для классификации респондентов использована модель RuGenerations, согласно которой респонденты были разделены на четыре группы: Хоумлендеры (от 2003 гг. р.); Миллениалы (1985–2002 гг. р.); Поколение X (1964–1984 гг. р.); Бумеры (до 1963 г. р.). Каждому респонденту было предложено оценить 15 аспектов своей трудовой деятельности по шкале от 0 до 10: общая удовлетворённость, условия труда, оплата, возможности развития, взаимоотношения с коллегами и руководством, признание заслуг, баланс работы и личной жизни и др. Также рассматривался индекс eNPS — метрика лояльности персонала, рассчитываемая как разность долей "промоутеров" и "критиков" компании.

Обработка данных проводилась в Python 3.10. Использовались следующие инструменты: pandas и numpy для работы с таблицами и массивами данных; fillna(df.mean()) для устранения пропусков; LabelEncoder() для преобразования категориальных признаков; describe() для получения описательной статистики; shapiro() из scipy.stats для проверки нормальности распределений; kruskal() для анализа различий между группами; chi2_contingency() — для проверки репрезентативности выборки; LinearRegression() из sklearn.linear_model — для построения моделей зависимости удовлетворённости от возраста; spearmanr() — для анализа корреляций между возрастом и аспектами удовлетворённости; mean() и методы groupby() — для расчета средних значений и eNPS по группам.

Проверка соответствия эмпирической выборки теоретической выполнена с помощью критерия хи-квадрат (p = 0.3294), что свидетельствует о репрезентативности данных. Пропуски в ответах отсутствовали либо были устранены с помощью среднего по колонке.

Тест Шапиро–Уилка показал, что распределение оценок по большинству шкал не является нормальным (p < 0.05), что обосновывает применение непараметрических методов.

Критерий Крускала–Уоллиса выявил статистически значимые различия между поколениями по следующим шкалам:

  • Признание заслуг: H = 9.21; p = 0.026;
  • Баланс работа–жизнь: H = 8.47; p = 0.037;
  • Возможности развития: H = 10.06; p = 0.018;
  • Лояльность (eNPS): p = 0.021 (расчёт по группам).

Наименьший показатель eNPS был выявлен у хоумлендеров (-21,05%), наивысший — у представителей поколения X (38,2%).

По методу Спирмена установлены умеренные и статистически значимые положительные корреляции между возрастом и следующими аспектами:

  • Баланс работы и жизни (rho = 0.47);
  • Признание заслуг (rho = 0.41);
  • Лояльность (rho = 0.59).

Регрессионная модель (LinearRegression()) позволила объяснить до 60% вариации в оценке общей удовлетворённости на основе возраста и стажа (R² = 0.60), что подтверждает значимость возрастного фактора.

Заключение

Полученные результаты подтверждают гипотезу о наличии генерационных различий в восприятии сотрудниками своей трудовой деятельности. Представители младших поколений, в частности хоумлендеры и миллениалы, в большей степени неудовлетворены возможностями развития, балансом работы и жизни, а также признанием заслуг. Это может быть обусловлено их более высокими ожиданиями от организационной среды, потребностью в постоянной обратной связи и развитии.

В то же время, сотрудники старших поколений склонны демонстрировать более высокую лояльность и удовлетворённость базовыми аспектами труда, такими как стабильность, признание, предсказуемость рабочего графика. Таким образом, подход к управлению персоналом должен учитывать не только профессиональные, но и особенности различных возрастных групп.

Инструменты Python показали свою эффективность как в этапах предобработки данных, так и в реализации сложных статистических процедур. Их использование в прикладной HR-аналитике позволяет перейти от описательной статистики к интерпретируемым и воспроизводимым выводам, основанным на объективных данных.

Предложенная методика может быть адаптирована для других организаций, где актуален анализ удовлетворенности сотрудников и построение персонализированных стратегий управления.

 

Список литературы:

  1. Баврина А. П., Борисов И. Б. Современные правила применения корреляционного анализа // Медицинский альманах. – 2021. – С. 70–79.
  2. RuGenerations. Российская школа Теории поколений [Электронный ресурс]. – URL: https://rugenerations.su/ (дата обращения: 03.04.2025 г.).
  3. Scikit-learn Documentation: sklearn.linear_model.LinearRegression // Scikit-learn Documentation. – URL: https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html (дата обращения: 25.05.2025).
  4. SciPy 1.13.1 Reference: scipy.stats.shapiro // SciPy Documentation. – URL: https://docs.scipy.org/doc/scipy-1.13.1/reference/generated/scipy.stats.shapiro.html (дата обращения: 25.03.2025).
  5. SciPy Documentation: scipy.stats.kruskal // SciPy Documentation. – URL: https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.kruskal.html (дата обращения: 25.03.2025).

Оставить комментарий