Статья опубликована в рамках: Научного журнала «Студенческий» № 14(226)
Рубрика журнала: Математика
Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3, скачать журнал часть 4, скачать журнал часть 5
РЕГРЕССИОННЫЙ АНАЛИЗ ФАКТОРОВ, ВЛИЯЮЩИХ НА ШАНС ПОБЕДЫ В НАСТОЛЬНОЙ ИГРЕ
MATHEMATICAL ANALYSIS OF FACTORS AFFECTING PERFORMANCE IN BOARD GAMES
Boltava Vladimir Andreevich
student, Novosibirsk State University Geosystems and Technologies,
Russia, Novosibirsk
Priporov Vladislav Dmitrievich
student, Novosibirsk State University Geosystems and Technologies,
Russia, Novosibirsk
Stroganov Danila Sergeevich
student, Novosibirsk State University Geosystems and Technologies,
Russia, Novosibirsk
АННОТАЦИЯ
Цель исследования – определить влияние различных факторов, которые поддаются конкретной математической или статистической оценке, на результативность в настольной игре Codenames. В статье рассмотрены такие факторы как: опыт капитана и игрока, количество игроков в команде, таймер, установленный на ход, средний уровень опыта команды. Научная новизна работы заключается в подходе к изучению данных факторов с помощью статистического и регрессионного анализа, основанного на реальной статистике, собранной с помощью опроса. В результате нами были выявлены конкретные закономерности и результаты исследования, которые уже сейчас могут быть использованы издателями и разработчиками настольных игр для более удобной и информативной разработки игрового процесса, а также его балансировки и тестирования.
ABSTRACT
The aim of the study is to determine the influence of various factors, which can be specifically mathematically or statistically evaluated, on the performance in the board game Codenames. The paper considers such factors as: the experience of the captain and the player, the number of players in the team, the timer set for the turn, the average level of experience of the team. The scientific novelty of the work lies in the approach to the study of these factors using statistical and regression analysis, based on real statistics collected through the survey. As a result, we have identified specific patterns and results of the study, which can already be used by publishers and developers of board games for more convenient and informative game design, as well as its balancing and testing.
Ключевые слова: статистика, регрессионный анализ, статистический анализ, настольные игры, математические измерения.
Keywords: statistics, regression analysis, statistical analysis, board games, mathematical measurements.
ВВЕДЕНИЕ И СТАТИСТИКА
Сегодня настольные игры становятся всё более популярным видом хобби. Но кроме того, индустрия настольных игр становится более интересной, с точки зрения ведения бизнеса. Statista – немецкая компания, специализирующаяся на рыночных и потребительских данных, сообщает, что общий доход в индустрии настольных игр вырастет в среднем на 8.81% с 2022 по 2026 год (рисунок 1).
Рисунок 1. Доход от настольных игр за 2017-2026 гг.
В ходе работы нами преследовались две основные цели:
Первая – создать опрос и получить наибольшее количество данных. При этом данные должны быть корректные, так что дополнительно нам предстояло отсеять часть полученных данных.
Вторая цель заключается в изучении факторов, которые оказывают влияние на результат игры. Мы хотим выяснить, какие параметры влияют на успех команды, и вычислить конкретные значения коэффициентов. Для этого нам необходимо проанализировать данные о прошлых играх и выделить наиболее значимые факторы, которые оказывают существенное влияние на победу команды.
Рынок настольных игр крайне разнообразен, на нем представлены игры всевозможных жанров и любой сложности для людей всех возрастов. Проанализировав список самых популярных игр, для нашего проекта мы выбрали игру Codenames (Кодовые имена), поскольку она содержит оптимальное число факторов, которые можно изучить, чтобы получить какие-либо выводы. Далее кратко будут представлены правила игры.
В этой игре участвует две команды. В каждой команде от 1 до 4 человек. Кроме того, у каждой команды есть капитан. Карточки со словами, находящиеся на игровом столе, относятся к одной из команд, однако среди них есть нейтральные слова и одна черная карточка, мгновенно ведущая к поражению. Суть игры заключается в том, что игроки не знают, какие карточки относятся к их команде, и пытаются угадать их, используя подсказки капитанов. Первая команда, которая угадывает все свои слова, побеждает.
Игра содержит много факторов, влияющих на результат. Из них мы выбрали наиболее значимые факторы, а затем отобрали те, которые поддаются конкретной математической или статистической оценке.
Первые два — это опыт игры игроков и капитанов, который измеряется в количестве ранее сыгранных партий, по шкале от 1 до 5, где первый уровень означает, что игрок сыграл 5 партий или меньше, а пятый уровень равен 30 и более сыгранным партиям. Далее, количество игроков в одной команде, установленное время на ход, а также средний уровень всей команды, включающий уровень капитана и каждого игрока.
Нами была разработана форма для опроса игроков. Она была разослана в различные тематические сообщества с целью получения как можно большего количества данных о реальных играх с разными игроками. Нам удалось получить ответы от официального издателя игры, а также от разработчика онлайн версии игры, который внедрил инструменты для сбора статистики в саму игру.
Таким образом нам удалось собрать практически 300 записей о реальных играх (рисунок 2), с учетом исключенных партий, в которых появлялась черная карточка, поскольку это случайное событие, которое невозможно рассчитать корректно.
Рисунок 2. Данные о собранной статистике с опроса
ЭФФЕКТИВНОСТЬ КОМАНДЫ
В созданном нами опросе игроки заполняли протокол каждого хода своей команды на протяжении всей партии. В этом протоколе указывается номер хода, количество отгаданных карточек своей команды в этот ход, количество отгаданных карточек команды противника и количество отгаданных нейтральных карточек. Эта статистика необходима для построения функции эффективности команды, чтобы в дальнейшем выполнить проверку того, как ранее упомянутые факторы влияют на эффективность. Далее перед нами возникла задача, каким образом рассчитать функцию эффективности. Оригинальные правила настольной игры сообщают, что команда должна угадать 8 или 9 своих карточек для победы (это количество зависит от того, ходит ли команда первой или второй). Получается, что 100% эффективность команды возможна в случае, если команда в свой первый ход угадает все свои карточки. Было рассчитано, что за первую правильно отгаданную карточку, команда будет получать по 7.4% эффективности, и далее, +20% за каждую следующую отгаданную карточку на этом ходу. В таком случае, если отгадать все карточки за один ход, эффективность команды будет равна 100%. Далее необходимо рассчитать нижнюю границу. Например, рассмотрим партию, в которой команда ни угадала ни одной карточки своей команды, но угадала все карточки команды противника за 8 ходов (так как выбор карточки противоположный команды мгновенно заканчивает текущий ход). В таком случае эффективность должна равняться -100%, следовательно, за каждую отгаданную карточку команды противника команда будет тереть по 11.7% эффективности. За отгадывание нейтральной карточки, команда теряет по 5% эффективности, так как теряет возможность угадать другие карточки в этот ход, а также уменьшает количество слов на игровом столе. Далее переходим к статистическому анализу собранных в результате опроса данных, чтобы затем сравнить их с данными, полученными при исследовании многофакторной регрессионной модели.
СТАТИСТИЧЕСКИЙ АНАЛИЗ
Первым графиком рассмотрим зависимость эффективности от количества игроков, без учета капитанов, по оси абсцисс находится исследуемый фактор, по оси ординат эффективность команды. (рисунок 3).
Рисунок 3. График зависимости эффективности от количества игроков
Исходя из графика, эффективность растет в среднем на 5.66% за каждого нового игрока в команде. Следующий график зависимости эффективности от навыков капитана (рисунок 4).
Рисунок 4. График зависимости эффективности от опыта капитана
Заметим, что эффективность растет в среднем на 5.9% за каждый уровень капитана. Следующий график покажет зависимость эффективности от установленного таймера на ход (рисунок 5).
Рисунок 5. График зависимости эффективности от времени на ход
График показывает, что эффективность растет в среднем на 6.1% за каждые 10 секунд таймера, но это справедливо только в рамках от 20 до 60 секунд, именно на этом промежутке мы проводили исследования. Переходим к последнему статистическому исследованию (рисунок 6).
Рисунок 6. Зависимость эффективности от среднего командного опыта.
Наблюдаем, что эффективность растет в среднем на 6.37% за каждую единицу среднего опыта команды. Подведем итоги, и сравним значения с результатами, полученными при исследовании регрессионной модели (рисунок 7).
Рисунок 7. Выявленные закономерности с помощью статистического анализа
МНОГОФАКТОРНАЯ РЕГРЕССИОННАЯ МОДЕЛЬ
С целью исследования влияния различных факторов на эффективность команды, а вследствие и на вероятность победы, было проведено исследование многофакторной регрессионной модели. Необходимо построить такую модель, чтобы между факторами отсутствовала мультиколлинеарность (то есть сильная корреляция между факторами). Выполняем построение корреляционной матрицы.
Таблица 1.
Корреляционная матрица
|
Эффективность |
Состав команды |
Таймер |
Опыт капитана |
Опыт команды |
Эффективность |
1 |
|
|
|
|
Состав |
0.410 |
1 |
|
|
|
Таймер |
0.298 |
0.180 |
1 |
|
|
Опыт капитана |
0.480 |
0.102 |
-0.205 |
1 |
|
Опыт команды |
0.367 |
0.111 |
-0.300 |
0.645 |
1 |
Коэффициенты в ячейках показывают корреляцию между факторами. Необходимо, чтобы под главной диагональю не было значений, превышающих 0.7. В противном случае, это означало бы сильную корреляцию между факторами, а, следовательно, такие факторы должны быть исключены из исследования. В нашем случае, все значения выполняют это условие. Однако, мы имеем два фактора с умеренной корреляцией в 0.64, что может существенно повлияет на результат исследования.
Далее рассчитываем коэффициенты, входящие в уравнение регрессии.
Таблица 2.
Полученные коэффициенты регрессии
|
Коэффициенты |
Y-пересечение () |
-18.97243829 |
Количество игроков без капитана |
5,747141164 |
Таймер хода |
0,607892915 |
Опыт капитана |
5,872996367 |
Средний опыт команды |
2,677659466 |
Полученные данные не имеют ценности, пока не будет доказана значимость этих факторов, а также значимость самой регрессионной модели. Проверим значения с помощью стандартной ошибки и t коэффициента Стьюдента.
Таблица 3.
Проверка факторов на значимость по критерию Стьюдента
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
Кол-во игроков без капитана |
5,747141164
|
0,880613092
|
6,52629539
|
Время хода |
0,607892915 |
0,071599591 |
8,490173032 |
Опыт капитана |
5,872996367 |
0,672534853 |
7,245715737 |
Опыт команды |
2,677659466 |
1,015482387 |
2,636834967 |
Табличное значение Стьюдента, при 294 степенях свободы и стандартной точности в 0.05, равно 1,968065689. Все числа, находящиеся в соответствующей колонке, превышают табличное значения. Это позволяет сделать вывод о значимости факторов, но требует дальнейшей проверки.
Таблица 4.
Проверка факторов на значимость с помощью вероятности нахождения в доверительном интервале
|
Коэффициенты |
P-Значение |
Нижние 95% |
Верхние 95%
|
Кол-во игроков без капитана |
5,747141164
|
2,94702E-10
|
4,014036752
|
7,480245576
|
Время хода |
0,607892915 |
1,03594E-15 |
0,466980217 |
0,748805614 |
Опыт капитана |
5,872996367 |
3,80114E-12 |
3,549403598 |
6,196589136 |
Опыт команды |
2,677659466 |
0,008813163 |
0,679123422 |
4,676195509 |
Итак, P-значение демонстрирует вероятность нахождения фактора в доверительном интервале, если это значение превышает 0.05, то фактор можно считать нулевым, что является недопустимым в таких исследованиях. Рассчитанные значения находятся ниже этой границы, что позволяет нам продолжать исследование. Доверительный интервал, нижние 95% и верхние 95%, позволяют определить значимость фактора. Этот предел не должен иметь противоречащих знаков, поскольку в противном случае, значение фактора может принимать, отрицательное, положительное, а также нулевое значение, что является недопустимым и противоречивым. Все выделенные факторы считаются значимыми и прошли все основные проверки. Далее рассчитываем значение Фишера и сравниваем результат с табличным. Таким образом, можно узнать объясненную и необъясненную дисперсию, чтобы сравнить их и проверить значимость самой регрессионной модели.
Таблица 5.
Дисперсионный анализ
|
F |
F-табл. |
Регрессия |
70,26149334 |
2,402352341 |
В результате получаем значение объяснённой дисперсии больше критического значения при данном уровне значимости (0.05). Это позволяет нам сделать вывод о том, что нулевая гипотеза отвергается, а значит, статистическая регрессия является значимой.
Подведем итоги проделанного регрессионного анализа. Независимые коэффициенты значимы. Регрессионная модель значима. Множественный R = 0,75, . R квадрат показывает, что 56% общей вариации результативного признака объясняется вариацией факторов включенных в регрессионную модель, а на 44% обусловлена другими неучтёнными факторами. Поскольку игра содержит фактор случайности, а также на результат влияет множество других факторов, не поддающихся математической оценке (например, взаимопонимание между игроками или настроение во время игры), можно сделать вывод, что в случае выбранной нами настольной игры это значение является приемлемым. Следовательно, выбранные факторы существенно влияют на эффективность, что подтверждает правильность их включения в построенную модель.
Такие результаты были получены в конце исследования (рисунок 8).
Рисунок 8. Сравнение исследований
Значимое отличие последнего фактора, как мы считаем, связано с умеренной корреляцией этого фактора с другим, либо в связи с недостаточным количеством данных для исследований.
ВЫВОДЫ
В данной статье был рассмотрен математический анализ факторов, влияющих на результативность в настольных играх. Результаты данного исследования могут быть полезны для научного сообщества, занимающегося проблематикой настольных игр. Модель, разработанная в рамках данной статьи, может быть использована как отправная точка для дальнейших исследований в этой области. Предложенный подход к анализу факторов, влияющих на результативность в настольных играх, может также быть применен в других областях, где необходимо оценить влияние различных факторов на результаты деятельности. В целом, данная статья может быть полезной для ученых и специалистов, работающих в области игровой теории и математического моделирования.
Разработчики настольных игр также могут воспользоваться результатами данного исследования для улучшения своих продуктов. Анализ факторов, влияющих на результативность в настольных играх, может помочь разработчикам создавать более сбалансированные игры, учитывая влияние различных факторов на исход игры. Также модель, предложенная в статье, может быть использована для тестирования и оценки новых игровых концепций. В целом, данное исследование может быть полезным инструментом для улучшения качества настольных игр и повышения их популярности среди игроков.
Список литературы:
- Дрейпер Н., Смит Г. Прикладной регрессионный анализ. Множественная регрессия // M.: Диалектика. 2007. № 3. С. 912.
- Вовк И.Г., Бугакова Т.Ю. Основы системно-целевого подхода и принятие решений: учеб. пособие // Новосибирск. СГГА. 2010. С. 119.
- Радченко С. Г. Устойчивые методы оценивания статистических моделей // К.: ПП Санспарель. 2005. C. 504.
- Радченко С. Г. Методология регрессионного анализа. // К.: Корнийчук. 2011. C. 376.
- Фёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа // M.: Финансы и статистика. 1981. C. 302
Оставить комментарий