Статья опубликована в рамках: Научного журнала «Студенческий» № 42(212)
Рубрика журнала: Математика
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5, скачать журнал часть 6, скачать журнал часть 7
РЕШЕНИЕ ЗАДАЧИ ПО МАКСИМИЗАЦИИ КАРЬЕРНЫХ ШАНСОВ С ПОМОЩЬЮ ТЕОРЕМЫ БАЙЕСА
SOLUTION OF THE PROBLEM OF MAXIMIZING CAREER CHANCES USING THE BAYES THEOREM
Alexandrov Maxim
student, department of Systems Engineering, Russian Technological University - MIREA,
Russia, Moscow
Zachesova Valeriya
student, department of Systems Engineering, Russian Technological University - MIREA,
Russia, Moscow
Chernysheva Anastasia
student, department of Systems Engineering, Russian Technological University - MIREA,
Russia, Moscow
АННОТАЦИЯ
В данной статье представлено решение задачи по максимизации карьерных шансов обучающихся по направлению «Системный анализ и управление» c помощью теоремы Байеса.
ABSTRACT
This article presents a solution to the problem of maximizing the career chances of students in the direction of "System Analysis and Management" using the Bayes theorem.
Ключевые слова: теорема Байеса, дерево решений, карьерные шансы, максимизация, системный аналитик.
Keywords: Bayes theorem, decision tree, career chances, maximization, systems analyst.
Перед нами поставлена задача максимизации карьерных шансов, обучающихся по направлению «Системный анализ и управление» на ближайшие 10-15 лет. Для получения более точной информации был составлен опрос, который проходили выпускники бакалавриата, магистратуры и аспирантуры направления «Системный анализ и управление». Каждый опрошенный на данный момент работает аналитиком или преподавателем на кафедре института. Чтобы проверить полученные данные задача будет решена двумя способами.
Способ 1. Рассмотрим классический пример Байесовского вывода
Каков шанс занять должность рядового и управляющего сотрудника после окончания ВО (бакалавриат/магистратура/аспирантура)?
Для начала определим шаги для проведения анализа:
- Определим гипотезу.
- Выразим убеждение в том, что каждая гипотеза верна с точки зрения априорных вероятностей (последствия).
- Соберем данные.
- Определим вероятность наблюдаемых данных в соответствии с каждой гипотезой.
- Используем теорему Байеса для вычисления апостериорных вероятностей для каждой гипотезы.
Теорема Байеса в общем виде:
, (1)
где Р(А) — априорная вероятность гипотезы A
P(A|B) — вероятность гипотезы A при наступлении события B (апостериорная вероятность);
P(B|A) — вероятность наступления события B при истинности гипотезы A;
Р(B) — полная вероятность наступления события B.
Шаг №1 – Определение гипотезы
Существует три уровня ВО – бакалавриат, магистратура, аспирантура. Надо определить какую должность с наибольшей вероятностью можно занять после окончания каждого уровня.
- Рядовой=Гипотеза рядового сотрудника
- Управляющий=Гипотеза сотрудника, занимающего управляющую должность
А=рядовой
~А=управляющий
Pr (рядовой)=Pr (~управляющий)
Pr (управляющий)=Pr (~рядовой)
Апостериорная вероятность того, что человек займет рядовую должность после окончания бакалавриата:
(2)
Апостериорная вероятность того, что человек займет управляющую должность после окончания бакалавриата:
(3)
Апостериорные вероятности для остальных уровней образования рассчитываются по аналогичным формулам.
Шаг №2 – Последствия
Выражаем наше убеждения в том, что каждая гипотеза верна с точки зрения априорных вероятностей.
Pr (рядовой) = априорная вероятность занять рядовую должность.
Pr (управляющий) = априорная вероятность занять управляющую должность
Pr (рядовой) = 0,5 и Pr (управляющий) = 0,5
Рисунок 1. Вероятность занять рядовую/управляющую должность
Шаг №3 – Сбор данных
- Pr (Рядовой| данные) = какова вероятность занять рядовую должность, учитывая уровень образования?
- Pr (Управляющий| данные) = какова вероятность занять управляющую должность, учитывая уровень образования?
Отличительным признаком будет уровень образования.
Для решения задачи Байесовского нами был создан опрос, в котором приняли участие люди с разными уровнями образования. Их попросили ответить на вопросы о том, какие уровни образования они закончили, и какую должность теперь занимают. Собранные данные представлены в таблице 1.
Таблица 1
Статистика участников опроса
рядовой |
управляющий |
СУММА |
|
бакалавриат |
17 |
3 |
20 |
магистратура |
13 |
20 |
33 |
аспирантура |
2 |
5 |
7 |
СУММА |
32 |
27 |
60 |
Используя эти данные, вычислили отличительные признаки:
Отличительный признак для уровня образования бакалавриат:
(3)
Отличительный признак для уровня образования магистратура:
(4)
Отличительный признак для уровня образования аспирантура:
(5)
Шаг №4 – Вывод
Стандартизированные результаты:
Рисунок 2. Стандартизированные результаты
Определим вероятность наблюдаемых данных, предполагая, что каждая гипотеза верна.
(6)
(7)
(8)
Pr(управляющий|магистратура)= (9)
Pr(рядовой|аспирантура)= (10)
Pr(управляющий|аспирантура)= (11)
Апостериорные вероятности:
Рисунок 3. Апостериорные вероятности
Вывод: исходя из решения задачи Байеса для максимизации своих карьерных шансов следует закончить аспирантуру.
Способ 2. Дерево решений.
Для решения данной задачи нарисуем дерево, в котором изначально присутствуют две ветви. Первая ветвь показывает ситуацию, когда бакалавриат не закончен и ведет к выбору действий – пойти работать не по профессии, либо же встать на биржу труда. Используя данные из источников, была вычислена вероятность для обоих этих действий, где вероятность пойти на работу не по профессии равна
=, (12)
а встать на биржу труда, соответственно, 1 – 0,85 = 0,15. Средний заработок для первого варианта в среднем равен 25.000 рублей, а для второго – 13.000 рублей. После находим среднее значения для данной ветви, 0,85*25.000+0,15*13.000 = 23200.
Теперь рассмотрим ветвь, где бакалавриат окончен. На данном этапе появляется новый выбор действий: пойти в магистратуру, либо же устроиться на работу. Рассмотрим второй вариант. С помощью проведенного опроса среди учащихся на направлении «Системный анализ и управление» была вычислена вероятность для возможных получаемых должностей. Для младшего рядового сотрудника
Pr(рядовой|бакалавриат)== (13)
с средней заработной платой равной 50.000 рублей, а для управляющего – 1 – 0,85 = 0,15 с заработной платой – 80.000 рублей. Далее было получено среднее значение для данной ветви, которое равно 0,85*50.000+0,15*80.000 = 75500.
Перейдем к другой ветви, которая подразумевает дальнейшее обучение в магистратуре. После окончания магистратуры снова появляется выбор действий. Пойти в аспирантуру, либо же устроиться на работу. Рассмотрим второй вариант. Из проведенного опроса средняя вероятность после окончания магистратуры устроиться на должность рядового сотрудника равна
, (14)
с средней заработной платы – 70.000, а на должность управляющего 1 – 0,39 = 0,61, с зарплатой 130.000. Далее вычисляем среднее значение данной ветви и получаем значение равное 0,39*70.000+0,61*130.000 = 106600.
Теперь рассмотрим вариант, когда аспирантура окончена. На основе данных, полученных в опросе, вероятность устроиться на должность рядового сотрудника равна
(15)
с заработной платой – 70.000 рублей, а на управляющую должность – 1 – 0,29 = 0, 71, с средней заработной платой 150.000 рублей. Вычислив среднее значение для данной ветви, было получено значение равное 0,29*70.000+0,71*150.000 =126800.
Сравним все средние значения для каждой из ветвей. Наилучший вариант действий: продолжать обучение до аспирантуры и только после нее устраиваться на работу. Этот вариант действий соответствует самому верхнему пути дерева решений. Двумя чертами отсечем ветви меньшим значением ожидаемой полезности.
Дерево решений представлено на рисунке 4.
Рисунок 4. Дерево решений
Вывод: исходя из дерева решения для максимизации своих карьерных шансов, следует закончить аспирантуру.
В ходе проделанной работы поставленная задача была решена двумя разными способами, и каждый из них привёл нас к одному результату. Чтобы максимизировать карьерные шансы стоит закончить аспирантуру, при этом прохождение стажировки, повышение квалификации и руководство наставника также влияют на потенциально-занимаемую должность в будущем.
Список литературы:
- Байесовская статистика: Star Wars, LEGO, резиновые уточки и многое другое. — СПб.: Питер, 2021. — 304 с.: ил. — (Серия «Библиотека программиста») [Электронный ресурс] https://www.rulit.me/data/programs/resources/pdf/Uill-Kurt-Bayesovskaya-statistika-Star-Wars-LEGO-rezinovye-utochki-i-mnogoe-drugoe_RuLit_Me_667087.pdf?ysclid=lbs9vidrj3214542941
- Елманова Н. Построение деревьев решений// КомпьютерПресс, № 12, 2003
- Опрос, созданный для сбора статистики у студентов бакалавриата, магистратуры и аспирантуры "Системный анализ и управление" https://docs.google.com/forms/d/e/1FAIpQLSc98Bm4RtKspOtWh7MwrzQJ8cmBPHMXR7eLAh3NLpKjJyqRuw/viewform
- Открытые данные по студентам на сайте министерства образования [Электронный ресурс] // https://minobrnauki.gov.ru/opendata/
- Hastie T., Tibshirani R., Friedman J. (2009). The Elements of Statistical Learning [Электронный ресурс] // https://hastie.su.domains/Papers/ESLII.pdf
Оставить комментарий