Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XIX Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 15 апреля 2014 г.)

Наука: Технические науки

Секция: Моделирование

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Новикова К.А., Самойленко Е.Н. РЕШЕНИЕ ЗАДАЧИ О МОДЕЛИРОВАНИИ ЗАВИСИМОСТИ КОЛИЧЕСТВА СОВЕРШЕННЫХ ПРЕСТУПЛЕНИЙ ОТ РАЗЛИЧНЫХ ФАКТОРОВ МЕТОДОМ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ // Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ: сб. ст. по мат. XIX междунар. студ. науч.-практ. конф. № 4(19). URL: http://sibac.info/archive/technic/4(19).pdf (дата обращения: 26.04.2024)
Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

РЕШЕНИЕ  ЗАДАЧИ  О  МОДЕЛИРОВАНИИ  ЗАВИСИМОСТИ  КОЛИЧЕСТВА  СОВЕРШЕННЫХ  ПРЕСТУПЛЕНИЙ  ОТ  РАЗЛИЧНЫХ  ФАКТОРОВ  МЕТОДОМ  ПАРНОЙ  ЛИНЕЙНОЙ  РЕГРЕССИИ

Новикова  Ксения  Алексеевна

студент  2-го  курса,  факультет  СПО,  ТИУиЭ,  РФ,  г.  Таганрог

E-mail: 

Самойленко  Екатерина  Николаевна

студент  2-го  курса,  факультет  СПО,  ТИУиЭ,  РФ,  г.  Таганрог

E-mail: 

Сахарова  Ольга  Николаевна

научный  руководитель,  канд.  техн.  наук,  доцент  ТИУиЭ,  РФ,  г.  Таганрог

 

В  настоящее  время  является  актуальным  поиск  методов  моделирования  и  прогнозирования  роста  количества  совершаемых  преступлений.  Для  решения  этой  задачи  может  быть  использован  метод  линейной  парной  регрессии,  хорошо  зарекомендовавший  себя  в  моделировании  экономических  систем.  Метод  линейной  парной  регрессии  достаточно  прост  и  позволяет  с  заданным  уровнем  погрешности  проводить  моделирование  и  прогнозирование  различных  процессов. 

Уравнение  линейной  парной  регрессии  имеет  вид  (1)  [4]:

 

(1), 

 

где:  у  —  зависимая  переменная  (результативный  признак); 

х  —  независимая,  объясняющая  переменная  (признак-фактор), 

ɛ   —  случайная  величина,  характеризующая  отклонения  реального  значения  результативного  признака  от  теоретического,  найденного  по  уравнению  регрессии.

Официальным  источником  данных  для  анализа  в  РФ  является  РОССТАТ,  который  содержит  официальные  результаты  статистических  исследований.  Все  действия  и  отчеты  РОССТАТа  подвергаются  международной  проверке,  и  были  признаны  надежными.  Поэтому  для  проведения  данного  исследования  были  использована  информация  официальной  статистики,  опубликованные  на  федеральном  портале  РОССТАТа  [2]. 

В  данном  случае  была  поставлена  задача  провести  моделирование  зависимости  количества  совершенных  преступлений  в  год  от  количества  потребления  алкоголя,  а  также  от  количества  беженцев  и  вынужденных  переселенцев  в  нашу  страну.  Исходные  данные  задачи  представлены  в  таблице  1  и  таблице  2.

Таблица  1

Данные  РОССТАТа  для  решения  задачи  линейной  парной  регрессии  (зависимость  количества  совершенных  преступлений  от  количества  зарегистрированных  больных  алкоголизмом)

Год

2005

2006

2007

2008

2009

2010

2011

2012

Зарегистрировано  больных  алкоголизмом,  тыс.чел

209,2

192,9

174,9

173,4

159,7

153,9

138,1

122,8

Количество  преступления  в  год,  тыс.чел

3554,7

3855,4

3582,5

3209,9

2994,8

2628,8

2404,8

2302,2

 

Таблица  2

Данные  РОССТАТа  для  решения  задачи  линейной  парной  регрессии  (зависимость  количества  совершенных  преступлений  от  количества  вынужденных  переселенцев  и  беженцев  РФ)

Год

2005

2006

2007

2008

2009

2010

2011

2012

Количество  вынужденных  переселенцев  и  беженцев,  тыс.чел

8914

7177

6802

4337

4092

2135

2096

2554

Количество  преступлений  в  год,  тыс.чел

3554,7

3855,4

3582,5

3209,9

2994,8

2628,8

2404,8

2302,2

 

Моделирование  проводилось  с  помощью  встроенных  функций  табличного  процессора  Microsoft  Excel  [5].  Для  этого  была  разработана  специальная  форма  (рисунок  1),  которая  позволяет  провести  анализ  зависимости  количества  совершенных  преступлений  от  любых  факторов.  Для  проведения  расчетов  в  качестве  независимой  переменной  выступают  количество  зарегистрированных  больных  алкоголизмом  и  количество  беженцев  и  вынужденных  переселенцев  в  РФ,  а  в  качестве  результативного  признака  —  соответственно  количество  зарегистрированных  преступлений. 

 

Рисунок  1.  Форма  для  проведения  расчетов  парной  линейной  регрессии  в  MS  Excel

 

Решение  задачи  включает  в  себя  4  основных  этапа:

1.  Построение  поля  корреляции.  Для  построения  поля  корреляции  необходимо  сформировать  область  данных,  на  основании  которых  с  помощью  встроенной  опции  График  табличный  процессор  MS  Excel  автоматически  строит  поле  корреляции  зависимостей  уровня  преступности  от  количества  эмигрантов  и  количества  потребления  алкоголя  (рисунок  2)  [1]. 

 

Рисунок  2.  Поле  корреляции

 

2.  Нахождение  параметров  уравнения  парной  линейной  регрессии.  Для  оценки  параметров  регрессий,  линейных  по  параметрам,  используется  метод  наименьших  квадратов  (МНК)  [3],  который  позволяет  получить  такие  оценки  параметров,  при  которых  сумма  квадратов  отклонений  фактических  значений  результативного  признака  у  от  теоретических  минимальна.  Для  оценки  параметров  уравнения  парной  линейной  регрессии  используются  следующие  формулы  [3]:

 

,(2) 

 

где:  xi  —  значение  независимой  переменной,  взятое  из  таблицы  исходных  данных, 

—  среднее  значение  независимой  переменной, 

у i  —  значение  результативного  признака, 

  —  среднее  значение  результативного  признака.  Для  определения  значение  параметров  уравнения  парной  регрессии  в  табличном  процессоре  MS  Excel  была  создана  специальная  форма  проведения  промежуточных  расходов  (рисунок  3)  [5].

 

Рисунок  3.  Таблицы  промежуточных  расчетов

 

Таким  образом,  в  результате  расчетов  получаются  следующие  уравнения  парной  линейной  регрессии:

у=-70,418+18,9421х  (3)  —  уравнение  зависимости  количество  совершенных  преступлений  от  количества  зарегистрированных  больных  алкоголизмом;  данное  уравнение  показывает,  что  на  каждую  единицу  изменения  (для  расчетов  рассматривались  тыс.человек,  на  каждую  тысячу)  больных  алкоголизмом,  приходится  почти  19  тыс.  преступлений;

у=2091,12+0,2048х  (4)  —  уравнение  зависимости  количество  совершенных  преступлений  от  количества  беженцев  и  вынужденных  переселенцев  в  РФ,  соответственно  на  каждую  тысячу  беженцев  и  вынужденных  переселенцев  приходится  почти  205  преступлений.

3.  Расчёт  линейного  коэффициента  корреляции  и  коэффициента  детерминации.  Проведенные  на  третьем  этапе  предварительные  расчеты  позволяют  достаточно  быстро  рассчитать  (рисунок  4)  коэффициент  корреляции  (5)  и  коэффициент  детерминации  (6)  [4]: 

 

,  где  2  (5)  и  (6)

 

Рисунок  4.  Расчет  коэффициентов  корреляции  и  детерминации

 

Полученный  коэффициент  корреляции  (рисунок  4а),  подтверждает  вывод,  сделанный  в  пункте  1,  связь  между  количеством  зарегистрированных  больных  алкоголизмом  и  количеством  совершенных  преступлений  прямая  и  довольно  сильная  (т.к.  значение  коэффициента  r=0,9177  близко  к  1).  Квадрат  коэффициента  корреляции  называется  коэффициентом  детерминации  (R2)  и  показывает  долю  вариации  результативного  признака,  объясненную  вариацией  факторного  признака.  В  данной  задаче  R=  0,8421,  т.  е.  84,21  %  вариации  результативного  признака  (количество  совершенных  преступлений)  объясняется  вариацией  факторного  признака  (количеством  зарегистрированных  больных  алкоголизмом)  [1].

Полученный  коэффициент  корреляции  (рисунок  4б),  подтверждает  вывод,  сделанный  в  пункте  1,  связь  между  количеством  беженцев  и  вынужденных  переселенцев  в  РФ  и  количеством  совершенных  преступлений  прямая  и  довольно  сильная  (т.  к.  значение  коэффициента  r=0,91  близко  к  1).  Соответственно  коэффициент  детерминации  R=  0,82857,  т.  е.  порядка  83  %  вариации  результативного  признака  (количество  совершенных  преступлений)  объясняется  вариацией  факторного  признака  (количеством  беженцев  и  вынужденных  переселенцев)  [1].

4.  Оценка  значимости  коэффициента  регрессии  и  уравнения  регрессии  в  целом.  Проверка  статистической  значимости  коэффициента  регрессии  проверяется  с  помощью  t-критерия  Стьюдента.  Для  этого  необходимо  сформулировать  гипотезы:  H0:  β=0  (линейной  зависимости  нет)  и  H1:  β0  (линейная  зависимость  есть).  Для  определения  фактическое  значение  t-критерия:  использовались  следующие  формулы  (7)  [3]:

 

,  где  (7). 

 

Таким  образом,  было  получено  расчетное  значение  Тнабл  =  2,59551  (рисунок  4а)  и  из  таблиц  критерия  Стьюдента  —  табличное  значение  tтабл.(α=0,05,  к=6)=2,4460.  Так  как,  Тнабл>  tтабл,  то  следовательно  с  вероятностью  95  %  можно  принять  альтернативную  гипотезу  о  статистической  значимости  коэффцициенты  регрессии. 

 

 

Оценка  статистической  значимости  построенной  модели  регрессии  в  целом  производится  с  помощью  F-критерия  Фишера.  Для  этого  необходимо  сформулировать  гипотезы:  H0:  R2=0  и  H1:  R20.  Определение  фактического  значения  F-критерия  осуществляется  в  соответствии  с  формулой  (8):    (8)  [3].  Далее  необходимо  сравнить  расчетные  значения  F-критерия  Фишера  и  табличные:  Fнабл  =  42,6596  и  Fнабл  =38,6665,  Fтабл(α=0,05,k1=1,k2=6)  =5,99.  Так  как  и  в  первом  и  во  втором  случае  Fнабл>Fтабл,  построенная  моделт  регрессии  в  целом  значима  и  может  быть  использована  для  построения  прогнозных  моделей  более  высокого  уровня  [1]. 

Таким  образом,  в  данной  работе  описан  метод  решения  задачи  о  регрессионном  анализе  зависимости  количества  совершенных  преступлений  двух  факторов  количеств  зарегистрированных  болных  алкоголизмом  и  количества  беженцев  и  вынужденных  переселенцев  в  Россию.  Предложенная  форма  в  табличном  процессоре  MS  Excel  позволяет  использовать  данный  дагоритм  решения  пободной  задачи  всех  пользоватеей.  Следовательно,  при  необходимости  можно  изменить  исходные  данные  в  таблицуе  MS  Excel  и  система  сама  проведет  все  необходимые  расчеты  и  сделает  базовые  выводы  о  корреляции  между  признаками.

 

 

Список  литературы:

1.Богатов  Д.Ф.,  Богатов  Ф.Г.  Конспект  лекций  и  практикум  по  математике  для  юристов:  Учебное  пособие  для  образовательных  учреждений  юридического  профиля.  М.:  «Приор-издат»,  2003.  —  448  с.

2.Данные  федеральной  службы  государственной  статистики:  [Электронный  ресурс]  —  Режим  доступа.  —  URL:  http://www.gks.ru/

3.Кремер  Н.Ш.,  Путко  Б.А.  Эконометрика:  учебник.  М.:Юнити-Дана,  2010  г.  —  328  с.

4.Магнус  Я.Р.,  Катышев  П.К.,  Пересецкий  А.А.  Эконометрика.  Начальный  курс:  учеб.  8-е  изд.,  исправленное.  М:  ДЕЛО,  2007  —  504  с.

5.Полянский  Ю.,  Вепрев  С.,  Лушников  М.  Эконометрика.  Решение  задач  с  использованием  электронных  таблиц  Microsoft  Excel.  Практикум.  М:  Академия  экономической  безопасности  МВД  России,  2005  г.  —  146  с.

 

Проголосовать за статью
Конференция завершена
Эта статья набрала 0 голосов
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.