Статья опубликована в рамках: Научного журнала «Студенческий» № 3(131)

Скачать книгу(-и): скачать журнал часть 1, скачать журнал часть 2, скачать журнал часть 3

Библиографическое описание:

Пирогова К.А. АНАЛИЗ МЕТОДОВ ПРОВЕРКИ ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ // Студенческий: электрон. научн. журн. 2021. № 3(131). URL: https://sibac.info/journal/student/131/199418 (дата обращения: 13.02.2026).

АНАЛИЗ МЕТОДОВ ПРОВЕРКИ ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Пирогова Кристина Андреевна

магистрант, кафедра Стандартизация, метрология и сертификация (СМИС), Московский политехнический университет,

РФ, г. Москва

Левина Татьяна Анатольевна

научный руководитель,

канд. экон. наук, доц., кафедра Стандартизация, метрология и сертификация (СМИС), Московский политехнический университет,

РФ, г. Москва

PROTECTION OF INFORMATION IN THE COMMUNICATION CHANNEL ON THE BASIS OF FORMING AN ANPHASE SIGNAL IN IT

Kristina Pirogova

Master's Degree, Department of Standardization, Metrology and Certification (SMIS), Moscow Polytechnic University,

Russia, Moscow

Tatyana Levina

scientific advisor, Ph.D. in Economics, Associate Professor Department of Standardization, Metrology and Certification (SMIS), Moscow Polytechnic University,

Russia, Moscow

АННОТАЦИЯ

В данной статье проанализированы статистические методы обработки результатов измерений, рассмотренные в ГОСТ Р 8.736-2011 «Государственная система обеспечения единства измерений (ГСИ). Измерения прямые многократные. Методы обработки результатов измерений. Основные положения», который распространяется на прямые многократные независимые измерения и устанавливает основные положения методов обработки результатов этих измерений и вычисления погрешностей оценки измеряемой величины.

Выявлен наиболее сложный и трудоемкий вычислительный процесс при использовании критерия ω2 Мизеса-Смирнова, предназначенного для проверки сложной гипотезы о нормальности распределения результатов измерений при числе измерений n≥50.

Предложено решение автоматизировать критерий ω2 Мизеса-Смирнова для снижения трудоемкости проверки отклонения распределения вероятностей от нормального распределения и уменьшения вероятности ошибки оператора, что непосредственно окажет существенную помощь инженерам, научным сотрудникам, специалистам, сталкивающимися в своей деятельности с необходимостью статистического анализа результатов экспериментов.

ABSTRACT

This article analyzes the statistical methods of processing measurement results, considered in GOST P 8.736-2011 "State System for The Unity of Measurements (GSI). The measurements are direct multiples. Methods for processing measurement results. The basic provisions" which apply to direct multiple independent measurements and establishes the main provisions of the methods of processing the results of these measurements and calculating the errors of the estimated magnitude.

The most complex and time-consuming computational process was identified using the Mises-Smirnov criterion, designed to test the complex hypothesis of the normality of the distribution of measurement results in the number of measurements n≥50. The proposed solution to automate the Mises-Smirnov criterion to reduce the laboriousness of checking the deviation of probability distribution from normal distribution and reduce the probability of operator error, which will directly provide significant assistance to engineers, scientists, specialists who face in their activities the need for statistical analysis of the results of experiments.

Ключевые слова: распределение вероятности, результат измерений, статистический критерий, отклонение.

Keywords: probability distribution, measuring result, statistical criterion, rejection.

ВВЕДЕНИЕ

В современной экономической ситуации более конкурентоспособен тот, кто быстрее реагирует на развитие научно-технического прогресса. А реалии диктуют нам всеобщую цифровизацию, которая основательно входит во все сферы человеческой деятельности. Автоматизация рутинных расчетов позволяет оптимизировать время и занятость персонала, освободить человека от работы, которая может выполняться по строго заданному алгоритму. Автоматизация охватила и такую сферу, как прикладная математическая статистика.

Методы прикладной математической статистики активно применяются в технических исследованиях, экономике, теории и практике управления (менеджмента), социологии, медицине, истории. Статистическая обработка данных, как правило, проводится с помощью программных продуктов.

На сегодняшний день математический аппарат проверки статистических гипотез является эффективным и гибким средством для анализа исследования статистических закономерностей.

В таких задачах статистический критерий представляет собой инструмент для анализа данных, для которого необходимо понимать, что он измеряет, особенности его применения, достоинства и недостатки, а также какие результаты можно получить и с какими ошибками при этом можно столкнуться.

Проверка гипотезы о принадлежности двух выборок случайных величин одной генеральной совокупности, или гипотезы однородности распределений, – это отдельная задача в теории проверки статистических гипотез.

Особенно широкое применение проверка статистической гипотезы однородности распределений получила в анализе продолжительности бесперебойной работы объектов в задачах теории надежности, где каждое наблюдение выборки – это время наблюдения за объектом.

В силу ряда причин нормальный закон распределения вероятностей занимает заметное место в задачах статистического анализа. Он используется в качестве модели для описания ошибок измерений некоторых приборов или систем, что не в последнюю очередь бывает связано с недостатком информации.

Принадлежность наблюдаемых данных нормальному закону является необходимой предпосылкой для корректного применения большинства классических методов математической статистики, используемых в задачах обработки измерений, стандартизации и контроля качества. Поэтому проверка на отклонение от нормального закона является частой процедурой в ходе проведения измерений, контроля и испытаний, имеющей особое значение, так как далеко не всегда ошибки измерений, связанные с приборами, построенными на различных физических принципах, или ошибки наблюдений некоторого контролируемого показателя подчиняются нормальному закону. В таких случаях применение классического аппарата, опирающегося на предположение о нормальности наблюдаемого закона, оказывается некорректным и может приводить к неверным выводам.

ОСНОВНАЯ ПРОБЛЕМАТИКА СТАТЬИ

Наличие множества статистических критериев ставит перед специалистами не простую задачу выбора, так как имеющаяся в публикациях информация не позволяет однозначно отдать предпочтение какому-то определенному критерию, а каждый специалист заинтересован не только в корректности использования выбранного критерия, но и качестве, надежности статистических выводов.

На основании данной проблемы мы проанализировали статистические методы обработки результатов измерений с использованием различных критериев, рассмотренные в ГОСТ Р 8.736-2011.

В 2013 году был введен в действие ГОСТ Р 8.736-2011 «Государственная система обеспечения единства измерений (ГСИ). Измерения прямые многократные. Методы обработки результатов измерений. Основные положения», который распространяется на прямые многократные независимые измерения и устанавливает основные положения методов обработки результатов этих измерений и вычисления погрешностей оценки измеряемой величины [1].

В данном стандарте рассмотрены следующие методы обработки результатов измерений:

Критерий Граббса - статистический критерий для исключения грубых погрешностей, базирующийся на предположении о том, что группа результатов измерений принадлежит нормальному распределению.

Последовательность обработки результатов измерений с использованием критерия Граббса можно представить в виде блок-схемы на рисунке 1.

Рисунок 1. Блок-схема последовательности обработки результатов измерений с использованием критерия Граббса

С помощью данной блок-схемы мы представили наиболее упрощенный алгоритм для любого новичка, который решит воспользоваться данным критерием. Один из блоков содержит значение – это критическое значение для критерия Граббса, которое является очень важным звеном в данном алгоритме, так как на заключительном этапе мы проверяем выполняются ли условия , если да, то тогда необходимо исключить грубые погрешности. Критическое значение определяется по таблице 1 в зависимости от определенного уровня значимости.

Таблица 1.

Критические значения для критерия Граббса

Следующие три рассмотренные критерия, относятся к доверительным границам случайной погрешности оценки измеряемой величины.

Доверительные границы случайной погрешности оценки измеряемой величины в соответствии с настоящим стандартом устанавливают для результатов измерений, принадлежащих нормальному распределению.

В зависимости от числа результатов измерений выбирается необходимый критерий, представленный на рисунке 2.

Рисунок 2. Блок-схема выбора критерия в зависимости от числа результатов измерений

Критерий Пирсона чаще всего используют для проверки критерия согласия теоретического распределения с практическим [3].

Проверку гипотезы выполняют по следующему алгоритму:

1.Проводят группировку всех значений результатов измерений по l группам (интервалам).

Таблица 2.

Число групп в зависимости от числа измерений

Количество измерений N	Число групп l
40-100	5-9
100-500	8-12
500-1000	10-16
1000-10000	12-22

2. Определяют минимальное значение и максимальное значение из всех результатов измерений (параметры и ).

3. Определяют длину каждого интервала (группы) по формуле 1.

(1)

4. Определяет границы для каждого интервала группировки. Границы первого интервала будут (; +h). Границы второго интервала - ( ; +2h). Верхняя граница последнего интервала соответствует параметру .

5. Определяют середины интервалов (параметр ) как полусумма верхней и нижней границы.

6. Определяют количество измерений, попавших в каждый интервал (определяют частоту, параметр ,).

7. Вычисляют среднее арифметическое значение результатов измерений по формуле 2 для сгруппированных данных:

(2)

где – количество измерений, попавших в i-тый интервал.

– середина i-того интервала.

8. Для каждого интервала рассчитывают значение выражения

9. Определяют выборочное стандартное отклонение для сгруппированных данных по формуле 3:

(3)

где – количество измерений, попавших в i-тый интервал.

– середина i-того интервала.

10. Для каждого интервала рассчитывают значение выражения по формуле 4:

(4)

11. Для каждого числа находят значение локальной функции Лапласа. Аргументы берутся по модулю. Табличные значения локальной функции Лапласа представлены в таблице 3. В этой таблице первый столбец – целые и десятичные доли аргумента. Первая строчка – сотые доли аргумента.

Таблица 3.

Табличные значения локальной функции Лапласа

12. Для каждого интервала рассчитывают теоретические частоты по формуле 5.

(5)

где N – количество измерений

13. Для каждого интервала вычисляют параметр по формуле 6:

(6)

14. Вычисляем параметр по формуле 7:

(7)

15. Рассчитанное значение сравнивают с табличным значением при выбранном уровне значимости α с степенями свободы. Для нормального распределения .

Если , то считают, что результаты измерений распределены по нормальному закону. (таблица 4)

Таблица 4.

Табличные значения

Рассмотрим следующий критерий Мизеса-Смирнова , основная идея которого состоит в измерении расстояния между функцией эмпирического распределения и функцией теоретического распределения [4].

Статистикой критерия Мизеса-Смирнова является средний квадрат отклонений между аналитической и эмпирической функциями обеспеченностей по всем значениям случайной величины х, которая имеет вид (8):

, (8)

где

- теоретическая функция распределения;

- эмпирическая функция распределения;

- весовая функция, область определения которой представляет собой область значений функции .

Конкретный вид статистики зависит от вида весовой функции, подразделяющейся на два вида:

1. - все значения функции распределения обладают одинаковым весом,

2. - вес результатов измерений увеличивается на "хвостах" распределений.

В данном критерии используется весовая функция второго вида, так как на практике различия между распределениями наиболее отчетливы в области крайних значений. Однако почти всегда малое число результатов измерений имеется как раз в области крайних значений. Поэтому целесообразно придать этим результатам больший вес.

Если принять весовую функцию второго вида, то статистика после выполнения интегрирования имеет вид (9):

, (9)

где - результаты измерений, упорядоченные по значению;

- значение функции теоретического распределения при значении аргумента, равном (.

Результаты измерений рекомендуется свести в таблицу, аналогичную таблице 6 расчетного примера применения критерия , а соответствующие им значения внести в третий столбец таблицы, аналогичной таблице 6 этого же примера.

Таблица 6.

Результаты промежуточных вычислений значения статистики

Статистика подчиняется асимптотическому (при ) распределению (10):

(10)

Значения функции распределения для с шагом 0,01 приведены в таблице 7.

Таблица 7.

Значения функции

Если эмпирическое значении статистики оказывается больше теоретического значения при уровне значимости a, то гипотеза о соответствии эмпирической и аналитической функций обеспеченностей опровергается.

Критерий ω2 более мощный, чем критерий Пирсона и в отличии от требует выполнения большого объема вычислительный операций, из чего следует, что данный критерий ω2 является наиболее трудоемким по сравнению с другими рассмотренными критериями и требует автоматизировать данный вычислительный процесс с помощью разработки программного продукта.

На основе изученного нормативного документа, можно сделать вывод, что в данном стандарте был выявлен один из самых трудоемких и с наиболее сложным вычислительным процессом критерий Мизеса-Смирнова, который непосредственно требует автоматизации, так как обработка результатов измерений распределения вероятностей от нормального распределения вручную очень сложный и трудоемкий процесс, от качества измерения информации зависит качество выпускаемой продукции, эффективность ее производства и использования, на которое оказывает большое влияние человеческий фактор. Возможным решением этой проблемы может стать программный продукт для обработки результатов измерений.

ЗАКЛЮЧЕНИЕ

В результате анализа нормативной технической документации было выявлено, что критерий ω2 Мизеса-Смирнова, предназначенный для проверки сложной гипотезы о принадлежности случайной величины x нормальному закону, является наиболее сложным и трудоемким критерием. В связи с этим данный критерий требует автоматизации для снижения трудоемкости обработки результатов и уменьшения вероятности ошибки оператора, что окажет существенную помощь инженерам, научным сотрудникам, специалистам, сталкивающимися в своей деятельности с необходимостью статистического анализа результатов экспериментов и заинтересованных в корректности проводимого статистического анализа.

Опираясь на компьютерные методы исследования статистических закономерностей, в основе которых лежит статистическое моделирование можно построить точные модели распределений статистик непараметрического критерия.

Список литературы:

ГОСТ Р 8.736-2011 Государственная система обеспечения единства измерений (ГСИ). Измерения прямые многократные. Методы обработки результатов измерений. Основные положения, 2011 – 24 с.
ГОСТ Р 7.0.5-2008 Система стандартов по информации, библиотечному и издательскому делу. Библиографическая ссылка. Общие требования и правила составления, 2008 – 44 с.
Статистика: уч. пособие / В.Я. Крохалев, С.А. Скопинов, В.А.Телешев; ФГБОУ ВО УГМУ Минздрава России. — Екатеринбург: Изд-во УГМУ, 2018 — 114 с.
Лемешко Б.Ю., Лемешко С.Б. Сравнительный анализ критериев проверки отклонения распределения от нормального закона // Метрология. 2005. №2. С. 3-24.

АНАЛИЗ МЕТОДОВ ПРОВЕРКИ ОТКЛОНЕНИЯ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТИ ОТ НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Оставить комментарий