Телефон: 8-800-350-22-65
WhatsApp: 8-800-350-22-65
Telegram: sibac
Прием заявок круглосуточно
График работы офиса: с 9.00 до 18.00 Нск (5.00 - 14.00 Мск)

Статья опубликована в рамках: XXI Международной научно-практической конференции «Инновации в науке» (Россия, г. Новосибирск, 17 июня 2013 г.)

Наука: Математика

Скачать книгу(-и): Сборник статей конференции

Библиографическое описание:
Орлов Н.Н., Орлова Е.Ю. ПОЛУЧЕНИЕ ТЕОРЕТИЧЕСКИХ КОЭФФИЦИЕНТОВ В УРАВНЕНИИ ПАРНОЙ ЛИНЕЙНОЙ РЕГРЕССИИ С ПОМОЩЬЮ МИНИМИЗАЦИИ ФУНКЦИОНАЛА ОШИБКИ // Инновации в науке: сб. ст. по матер. XXI междунар. науч.-практ. конф. – Новосибирск: СибАК, 2013.
Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов
Статья опубликована в рамках:
 
 
Выходные данные сборника:

 

ПОЛУЧЕНИЕ  ТЕОРЕТИЧЕСКИХ  КОЭФФИЦИЕНТОВ В  УРАВНЕНИИ  ПАРНОЙ  ЛИНЕЙНОЙ  РЕГРЕССИИ  С  ПОМОЩЬЮ  МИНИМИЗАЦИИ  ФУНКЦИОНАЛА  ОШИБКИ

Орлов  Николай  Николаевич

канд.  ф.-м.  наук,  доцент,  Институт  коммерции  и  права,  зав.кафедрой  информатики  и  математики,  г.  Москва

E-mailn_orloff@mail.ru

Орлова  Елена  Юрьевна

канд.  техн.  наук,  доцент,  Международный  университет  природы,  общества  и  человека  «Дубна»,  зав.  заочным  отделением  филиала  «Котельники»,  г.  Дубна

E-mailorlova.elena.urjevna@mail.ru

 

THEORETICAL  COEFFICIENT  CALCULATION  IN  LINEAR  REGRESSION  EQUATION  BY  MINIMIZING  OF  FUNCTIONAL  VARIATIONS

Orlov  Nikolai

PHd  of  Physical  and  Mathematical  Sciences,  Professor,  Institute  of  Commerce  and  Law,  Head  of  Department  of  Computer  Science  and  Mathematics,  Moscow

Orlova  Elena

PHd  of  Science,  Associate  Professor,  International  University  of  Nature,  Society  and  Man  "Dubna",  Head  of  the  department  of  distance  learning  branch  "Kotelniki",  Dubna

 

АННОТАЦИЯ

Работа  посвящена  параметризации  линейной  регрессии.  Представлен  метод  определения  теоретических  коэффициентов  парной  линейной  регрессии  путем  минимизации  функционала  ошибки.  Проанализировано  соответствие  полученных  формул  с  результатами  метода  наименьших  квадратов.

ABSTRACT

The  work  is  devoted  to  the  parameterization  of  the  linear  regression.  The  method  of  determining  the  theoretical  Simple  Linear  Regression  coefficients  by  minimizing  the  functional  errors  is  presented  in  the  work.  The  correspondence  of  the  formulas  obtained  with  the  results  of  the  method  of  least  squares  is  analyzed.

 

Ключевые  слова:  линейная  регрессия;  ошибка  аппроксимации;  минимум  функционала;  коэффициенты  уравнения;  коэффициент  корреляции.

Key  words:  linear  regression,  error  of  approximation;  functional  minimum,  and  the  coefficients  of  the  equation,  the  coefficient  of  correlation.

 

Введение

Во  всех  современных  публикациях  вывод  эмпирических  коэффициентов  уравнения  линейной  регрессии  основан  на  методе  наименьших  квадратов.  Полученные  коэффициенты  являются  оценками  теоретических  коэффициентов,  хотя  в  теории  должно  быть  наоборот  —  известны  теоретические  величины,  для  которых  находятся  эмпирические  оценки.

1.  Функционал  ошибки  и  его  минимум

Для  определения  эмпирических  коэффициентов  в  уравнении  линейной  регрессии  используется  метод  наименьших  квадратов  (МНК).  В  данной  работе  предлагается  минимизировать  функционал,  который  позволяет  получить  формулы  для  вычисления  теоретических  коэффициентов  уравнения  линейной  регрессии.

Для  простоты  изложения  все  выкладки  проводятся  для  случая  парной  линейной  регрессии.

Пусть  имеются  две  непрерывные  случайные  величины  X  и  Y  с  функцией  плотности  распределения  вероятности  f(x,y).  Требуется  найти  такую  линейную  аппроксимацию  (1),  в  которой  ошибка    была  бы  наименьшей  в  «вероятностном»  смысле:

 

,                             (1)

 

здесь    и    —некоторые  параметры,  подлежащие  определению.

Будем  искать  значения    и    путем  минимизации  следующего  функционала:

 

,                          (2)

 

который  представляет  собой  интегральную  ошибку  линейной  аппроксимации:

 

,                                   (3)

 

учитывающую  совместную  вероятность  распределения    случайных  величин  Х  и  Y

Так  как  функции    и    для  любых  значений  ,  то  функционал    имеет  минимум,  который  находится  из  условий:

 

.                            (4)

 

Найдем  эти  производные:

 

,  (5)

,  (6)

 

здесь  введены  следующие  обозначения:

 

                 (7)

             (8)

 

Из  решения  системы  линейных  уравнений  (5)  и  (6)  получим  формулы  для  вычисления  неизвестных  коэффициентов    и  :

 

,                       (9)

,                      (10)

,                     (11)

 

Где

 

.              (12)

 

При  выводе  формул  (10)  и  (11)  не  предполагались  какие-либо  ограничения,  кроме  условия  (2).  Следовательно,  среди  всех  зависимостей  вида  (1)  коэффициенты    и  ,  найденные  по  (10),  (11),  приводят  к  минимальной  в  смысле  (2)  погрешности  аппроксимации.

2.  Свойства  ошибки  аппроксимации

Из  условий  (5)  и  (6)  вытекают  следующие  свойства  случайной
величины  :

 

1)  ,                                                      (13)

2)  ,                                                             (14)

3) 

.                            (15)

Подставим  найденные  значения    и  в  основной  интеграл  :

 

,                              (16)

 

где

 

  —  коэффициент  корреляции.                   (17)

 

Так  как  ,  то 

 

или   .                             (18)

 

Очевидно,  что  при             ошибка  аппроксимации

 

.                             (19)

 

Из  непрерывности  подынтегральной  функции    следует,  что    для  всех  ,  т.  е.  случайная  величина  Y  является  линейной  функцией  от  случайной  величины  X:

 

.                                       (20)

 

Из  (17)  следует,  что  при  значении    :  

 

     или          ,          (21)

 

т.  е.

,                          (22)

 

что  равносильно  утверждению,  что  между  величинами  X  и  Y  нет  линейной  зависимости  или  эта  зависимость  имеет  более  сложный  характер.

Случай  выполнения  равенства  (19)  равносилен  следующему  соотношению  (некоррелированность  случайных  величин    и  ):

 

.                          (23)

 

3.  Переход  к  формулам  классической  парной  линейной  регрессии

Пусть  имеются  некоторые  экспериментальные  данные:  ,  являющиеся  репрезентативной  выборкой  объема  «n».  В  этом  случае,  используя  точечные  оценки  характеристик    и  ,  можно  получить  формулы  для  вычисления  коэффициентов    и    (экспериментальных  значений  теоретических  величин    и  )  соответственно  [1,  с.  62]:

 

,                              (24)

,                                     (25)

,                                        (26)

,                              (27)

 

где      ,          ,

 

,       .                                     (28)

 

Свойства  (13),  (14)  и  (15)  имеют  аналоги:

 

1)  ,                                      (29)

2) 

  ,                    (30)

3).                   (31)

 

Значение  ошибки  из  экспериментальных  данных  определяются  таким  образом:

 

  .                                               (32)

 

Заключение

С  помощью  предложенного  метода  минимизации  функционала  ошибки:

1.  При  выводе  формул  (10)  и  (11)  не  предполагались  какие-либо  ограничения,  кроме  условия  (2).  Следовательно,  среди  всех  зависимостей  вида  (1)  коэффициенты    и  ,  найденные  по  (10),  (11),  приводят  к  минимальной  в  смысле  (2)  погрешности  аппроксимации.

2.  Получены  формулы  (10),  (11)  для  вычисления  теоретических  коэффициентов    и    парной  линейной  регрессии.

3.  Показано,  что  если  ,  то  между  случайными  величинами  X  и  Y  имеется  линейная  зависимость.

4.  В  случае  репрезентативной  выборки  по  формулам  (25),  (26)  и  (27)  можно  найти  соответствующие  (экспериментальные)  приближения    и    теоретических  величин    и  .

5.  Соотношения  (25)—(26),  полученные  заменой  в  формулах  (10)—(11)  соответствующих  величин  их  статистическими  (выборочными)  характеристиками  (точечными  оценками),  совпадают  с  формулами,  найденными  по  методу  наименьших  квадратов. 

 

Список  литературы:

1.Доугерти  К.  Введение  в  эконометрику:  Пер.  с  англ.  —  М.:ИНФРА-М,  2001.  —  XIV,  402  с.,  ISBN  5-86-225-458-7.

Проголосовать за статью
Дипломы участников
У данной статьи нет
дипломов

Оставить комментарий

Форма обратной связи о взаимодействии с сайтом
CAPTCHA
Этот вопрос задается для того, чтобы выяснить, являетесь ли Вы человеком или представляете из себя автоматическую спам-рассылку.