Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Критерии проверки отклонения распределения от равномерного закона. Руководство по применению

Покупка
Основная коллекция
Артикул: 369600.03.01
К покупке доступен более свежий выпуск Перейти
Монография рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотезы о принадлежности анализируемых данных равномерному закону распределения вероятностей. Рассматриваются и сравниваются специальные критерии проверки равномерности, непараметрические критерии согласия и критерий согласия х2 Пирсона. Указываются недостатки и преимущества различных критериев. Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев. Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), сталкивающимся в своей деятельности с необходимостью статистического анализа результатов экспериментов, а также преподавателям вузов, аспирантам и студентам.
Лемешко, Б. Ю. Критерии проверки отклонения распределения от равномерного закона. Руководство по применению : монография / Б. Ю. Лемешко, П. Ю. Блинов. — Москва : ИНФРА-М, 2020. — 183 с. — (Научная мысль). - ISBN 978-5-16-011011-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1036458 (дата обращения: 18.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Москва
ИНФРА-М
2020

КРИТЕРИИ 
КРИТЕРИИ 

ПРОВЕРКИ ОТКЛОНЕНИЯ 
ПРОВЕРКИ ОТКЛОНЕНИЯ 

РАСПРЕДЕЛЕНИЯ 
РАСПРЕДЕЛЕНИЯ 

ОТ РАВНОМЕРНОГО ЗАКОНА
ОТ РАВНОМЕРНОГО ЗАКОНА

РУКОВОДСТВО ПО ПРИМЕНЕНИЮ
РУКОВОДСТВО ПО ПРИМЕНЕНИЮ

Б.Ю. Лемешко
Б.Ю. Лемешко
П.Ю. Блинов
П.Ю. Блинов

Монография

Лемешко Б.Ю.
Критерии проверки отклонения распределения от равномерного 
закона. Руководство по применению : монография / Б.Ю. Лемешко, 
П.Ю. Блинов. — М. : ИНФРА-М, 2020. — 183 с. — (Научная мысль). — 
www.dx.doi.org/10.12737/11304.

ISBN 978-5-16-011011-0 (print)
ISBN 978-5-16-103060-8 (online)
Монография рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, 
обработкой результатов экспериментов, применением статистических методов 
для анализа различных аспектов и тенденций окружающей действительности. 
В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотезы о принадлежности анализируемых данных равномерному закону распределения вероятностей. Рассматриваются и сравниваются специальные критерии проверки равномерности, 
непараметрические критерии согласия и критерий согласия 2 Пирсона. Указываются недостатки и преимущества различных критериев.
Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев.
Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных. 
Будет полезна инженерам, научным сотрудникам, специалистам различного 
профиля (медикам, биологам, социологам, экономистам и др.), сталкивающимся в своей деятельности с необходимостью статистического анализа результатов 
экспериментов, а также преподавателям вузов, аспирантам и студентам.

УДК 519.23(075.4)
ББК 22.172

Р е ц е н з е н т ы: 
А.А. Попов — доктор технических наук, профессор;
В.А. Селезнев — доктор физико-математических наук, профессор

УДК 519.23(075.4)
ББК 22.172
 
Л44

© Лемешко Б.Ю., Блинов П.Ю., 2015
ISBN 978-5-16-011011-0 (print)
ISBN 978-5-16-103060-8 (online)

Л44

Подписано в печать 06.06.2019.
Формат 6090/16. Печать офсетная. Бумага офсетная.
Гарнитура Newton. Усл. печ. л. 11,44.
ППТ12. Заказ  № 00000

ТК 369600-1036458-250415

ООО «Научно-издательский центр ИНФРА-М»
127214, Москва, ул. Полярная, д. 31В, стр. 1
Тел.: (495) 280-15-96, 280-33-86. Факс: (495) 280-36-29
E-mail: books@infra-m.ru        http://www.infra-m.ru

ФЗ 
№ 436-ФЗ
Издание не подлежит маркировке 
в соответствии с п. 1 ч. 2 ст. 1

Отпечатано в типографии ООО «Научно-издательский центр ИНФРА-М»
127214, Москва, ул. Полярная, д. 31В, стр. 1
Тел.: (495) 280-15-96, 280-33-86. Факс: (495) 280-36-29

ПРЕДИСЛОВИЕ

В прикладной математической статистике равномерный закон распределения вероятностей занимает видное место. 
Критериев, которые могут быть использованы для проверки гипотезы о принадлежности выборки равномерному закону, достаточно много. 
Это и множество специальных критериев, целенаправленно построенных для проверки гипотезы о принадлежности анализируемой выборки 
равномерному закону (Шермана, Кимбелла, Морана, Ченга–Спиринга, 
Хегази–Грина, 
Янга, 
Фросини, 
Гринвуда, 
Гринвуда–Кэсеберри–
Миллера, Неймана–Бартона и др.). Это совокупность классических непараметрических критериев согласия Колмогорова, Крамера–Мизеса–
Смирнова, Андерсона–Дарлинга, Купера, Ватсона и три не так давно 
предложенных критерия Жанга. Это, наконец, критерий 
2
χ
Пирсона.

История применения многих критериев насчитывает несколько десятилетий. Появляются публикации с новыми предложениями. Однако не 
смотря на множество публикаций не хватает объективной информации о 
действительных свойствах критериев, их достоинствах и недостатках. 
Можно натолкнуться на авторитетные мнения о целесообразности применения тех или иных критериев, которые не подкрепляются результатами сравнительного анализа и не всегда подтверждаются при проверке.
Специалистов, сталкивающихся в своей практической деятельности с 
необходимостью статистического анализа результатов экспериментов и, 
естественно, с проблемой проверки гипотез о принадлежности наблюдений или ошибок измерений равномерному закону, интересует, какие 
критерии предпочтительнее использовать и почему. Какие критерии обладают большей мощностью? Существуют ли “подводные камни”, отражающиеся на результатах анализа?
Рекомендации по применению критериев проверки гипотезы о равномерности наблюдаемого закона подготовлены с учетом результатов 
наших исследований свойств специальных критериев [4, 55, 56], однако 
основной объём необходимых исследований был проведен при подготовке настоящего руководства. Исследования позволили провести сравнительный анализ мощности критериев относительно различных альтернатив, впервые позволили указать на существенные недостатки 
некоторых популярных критериев, проявляющиеся при проверке этой 
гипотезы. 

Мы не можем утверждать, что проанализированы все существующие 
(ранее предложенные) критерии проверки равномерности, так как появляются новые публикации. Однако хочется надеяться, что настоящая 
книга, как и руководство по непараметрическим критериям согласия 
[77], как и руководство по критериям нормальности [78], или рекомендации по применению критериев типа 
2
χ
[80], окажет реальную по
мощь специалистам, заинтересованным в корректности проводимого 
статистического анализа.
Основная часть исследований, способствующих подготовке данного 
руководства, выполнена при поддержке Министерства образования и 
науки РФ в рамках проектной части государственного задания (проект 
№ 2.541.2014/К).

Б.Ю. Лемешко
Март 2015

ВВЕДЕНИЕ

Проверке гипотез о принадлежности выборки равномерному закону 
распределения посвящено множество работ, в которых авторами предложен достаточно обширный перечень статистических критериев. В определенной степени обилие критериев обусловлено тем интересом, который 
проявляется к использованию модели равномерного закона в различных 
приложениях. Частота применения модели равномерного закона в задачах 
статистического анализа в приложениях не в последнюю очередь определяется тем, что использование такой простой модели во многих ситуациях 
позволяет найти решение задачи с опорой только на аналитические методы. Если применение модели равномерного закона обосновано, то многие 
статистические выводы оказываются проще.
Равномерный закон зачастую используется для описания ошибок измерений некоторых приборов или измерительных систем.
В системах статистического моделирования крайне необходима возможность моделирования псевдослучайных величин в соответствии с различными параметрическими законами, что, как правило, реализуется на 
базе датчиков равномерных псевдослучайных величин с использованием 
метода обратных функций. Понятно, что результат в существенной степени зависит от качества датчика равномерных псевдослучайных чисел.
Множество приложений, в которых сталкиваются с использованием 
модели равномерного закона распределения вероятностей, объясняет повышенный интерес к выбору простых в вычислительном отношении и 
эффективных критериев проверки гипотез о принадлежности анализируемых выборок равномерному закону.
Если случайные величины 
1
2
,
,...,
n
X
X
X
принадлежат некоторому за
кону с функцией распределения вероятностей
 
F x , то случайные вели
чины


i
i
Y
F X

, 
1,
i
n

распределены равномерно на интервале 

0,1 . 

Поэтому во многих ситуациях вместо проверки гипотезы о принадлежности выборки 
1
2
,
,...,
n
X
X
X
закону с функцией распределения 
 
F x
зача
стую переходят к проверке гипотезы о принадлежности 
1
2
,
,...,
n
Y Y
Y равномерному закону. Не будет лишним заметить, что при подобном переходе 
использование классических критериев проверки равномерности, ориентированных на проверку простой гипотезы о принадлежности выборки 
равномерному закону, корректно, если 
 
F x
известно с точностью до 

значений параметров. Если же вектор параметров θ закона 


,
F x θ
оце
нивался по выборке 
1
2
,
,...,
n
X
X
X , то при справедливости проверяемой 
гипотезы 
0
H
распределение статистики любого критерия равномерности 
будет отличаться от имеющего место при проверке простой гипотезы.
Наличие множества критериев ставит перед практиками не очень простую задачу выбора, так как имеющаяся в публикациях информация не 
позволяет однозначно отдать предпочтение какому-то определенному 
критерию. 
При подготовке данного руководства множество рассматриваемых 
критериев равномерности исследовалось методами статистического моделирования. При исследовании распределений статистик соответствующих 
критериев количество экспериментов, осуществляемых при статистическом моделировании, как правило, принималось равным 1 660 000. Такое 
количество экспериментов позволяет, с одной стороны, проследить качественную картину, отражающую изменение распределений статистик в 
зависимости от различных факторов, с другой – обеспечить приемлемую 
точность получаемых оценок мощности и искомых вероятностей. 
Компьютерные методы анализа дают возможность выявить достоинства и недостатки отдельных критериев, оценить при каких объемах выборок отличием действительных распределений статистик (при справедливости проверяемой гипотезы) от асимптотических (предельных) 
распределений статистик можно практически пренебречь, позволяют провести сравнительный анализ мощности критериев относительно различных конкурирующих гипотез, выделить наиболее предпочтительные критерии. 
В первом разделе даны некоторые общие сведения, связанные с проверкой статистических гипотез, позволяющие специалистам, сталкивающимся с необходимостью статистического анализа данных экспериментальных исследований, с пониманием относиться к выбору критерия и 
результатам статистических выводов, корректно применять соответствующие критерии. Здесь же приводятся законы, близкие к равномерному и
рассматриваемые в качестве конкурирующих гипотез, относительно которых в последующих разделах приводятся оценки мощности различных 
критериев, применяемых при проверке гипотезы о принадлежности анализируемых выборок равномерному закону распределения. Законы, соответствующие конкурирующим гипотезам, подобраны так, чтобы продемонстрировать “узкие места” и реальные возможности критериев, 
особенно, при ограниченных объёмах выборок.
Во втором разделе рассматривается множество специальных критериев, ориентированных исключительно на проверку гипотезы о принадлежности извлекаемых выборок (анализируемых данных) равномерному закону, подчеркиваются недостатки отдельных критериев, приводятся 

оценки мощности критериев относительно рассматриваемых конкурирующих гипотез, приводятся результаты сравнительного анализа мощности 
критериев. Пожалуй, впервые явно демонстрируется (при малых объёмах 
выборок и малых уровнях значимости) смещённость некоторых критериев 
относительно определенных конкурирующих гипотез.
В третьем разделе для проверки гипотезы о равномерности рассматривается применение множества классических непараметрических критериев согласия, приводятся оценки мощности критериев и результаты сравнительного анализа. Также впервые показывается, что при малых объёмах 
выборок целый ряд критериев согласия оказываются смещёнными относительно тех же конкурирующих законов, которые не могут отличать от 
равномерного и некоторые специальные критерии.
В четвертом разделе рассматриваются вопросы применения для проверки равномерности критерия согласия 
2
χ
Пирсона. Оценки мощности 
критерия сравнивается с мощностью непараметрических критериев согласия.
В пятом разделе приведен сравнительный анализ мощности всего 
множества рассмотренных критериев, даются рекомендации по применению конкретных критериев.

1. ОБЩИЕ ПОЛОЖЕНИЯ

1.1. ПРОВЕРЯЕМАЯ ГИПОТЕЗА 
И РАССМАТРИВАЕМЫЕ КРИТЕРИИ ПРОВЕРКИ

Равномерное распределение случайной величины X
на интервале 
[0,1] будем обозначать как 


0,1
Rav
. Функция распределения вероятно
стей равномерного закона имеет вид 
( )
F x
x

при 
[0,1]
x 
. Для случайной величины, равномерно распределённой на интервале [ , ]
a b , функция 

распределения имеет вид
( )
x
a
F x
b
a



при 
[ , ]
x
a b

.

При проверке гипотезы о принадлежности наблюдаемой случайной 
величины равномерному закону простая проверяемая гипотеза имеет вид 

0
H : X 


0,1
Rav
или 
0
H : X 


,
Rav a b , где a и b известны. Эту же 

гипотезу можно записать как
0
H : 
( )
F x
x

, 
[0,1]
x 
или 
0
H : 

( )
x
a
F x
b
a




, 
[ , ]
x
a b

.

Проверяемая гипотеза будет сложной, если по данной выборке находится и область определения равномерной случайной величины.
Пусть 
1
2
,
,...,
n
X
X
X
– выборка независимых наблюдений случайной 
величины X . 
Для проверки гипотезы о принадлежности выборки независимых одинаково распределенных случайных величин 
1
2
,
,...,
n
X
X
X
равномерному 
закону может использоваться ряд критериев, построенных специально для 
проверки этой гипотезы, а также применяться совокупность классических 
непараметрических критериев согласия (Колмогорова, Купера, Крамера–
Мизеса–Смирнова, Ватсона, Андерсона–Дарлинга, Жанга) и критерий
согласия 
2
χ
Пирсона.
В большинстве критериев проверки равномерности опираются на 
оценки порядковых статистик величины X (элементы 
( )i
x
вариационного 

ряда 
(1)
(2)
( )
...
n
x
x
x



, построенного по выборке 
1
2
,
,...,
n
X
X
X ), которые 

в дальнейшем будем обозначать как 
i
U (то есть, 
( )
i
i
U
x

).

В множестве “специальных” критериев проверки гипотезы о равномерности можно выделить три группы. 
Статистики критериев первой группы предусматривают использование  
разностей последовательных значений вариационного ряда

1
i
i
i
D
U
U 


,

где 
0
0
U 
, 
1
1
n
U   , n – объем выборки.
К критериям второй группы относятся различные модификации критериев, использующие разности оценок порядковых статистик, соответствующих анализируемой выборке, и математических ожиданий этих порядковых статистик.
Третью группу составляют, так называемые, энтропийные критерии, 
опирающиеся на различные оценки энтропии.
Как правило, все “специальные” критерии ориентированы на проверку 
простой гипотезы 
0
H .
Четвёртую группу составляют непараметрические критерии согласия, 
применяемые для проверки равномерности. 
Единственным представителем пятой группы является критерий 
2
χ
Пирсона.
Как увидим в дальнейшем, использование “специальных” критериев 
проверки равномерности не даёт каких-то явных преимуществ перед использованием “общих” классических непараметрических критериев согласия. При этом наименее мощными, как правило, оказываются представители первой группы критериев, использующие различные разности
значений вариационного ряда.

1.2. ОБЩИЕ СВЕДЕНИЯ 
О ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

С каждым из используемых для проверки гипотезы 
0
H
критериев связана соответствующая статистика S , которая в соответствии с некоторой 
мерой измеряет расстояние между равномерным законом распределения 
вероятностей и эмпирическим законом, определяемым выборкой. В силу 
случайности извлекаемых выборок случайными оказываются и значения 
статистики S , вычисляемые в соответствии с этими выборками. При 
справедливости проверяемой гипотезы 
0
H
статистика S
подчиняется 

некоторому распределению 
0
(
)
G S H
.

Схема проверки гипотезы заключается в следующем. Область определения статистики разбивается на два подмножества, одно из которых 
представляет собой критическую область, и попадание в которую при 
справедливости 
0
H
маловероятно. При попадании вычисленного по вы
борке значения 

*
S
статистики S
в критическую область проверяемая 
гипотеза 
0
H
отклоняется (отвергается). В противном случае – нет осно
ваний для отклонения гипотезы 
0
H .  

Заметим, что не отклонение гипотезы 
0
H
в процессе проверки не 
означает, что она справедлива. Истинный закон распределения реальных 
случайных величин остается всегда неизвестным. Результат проверки 
свидетельствует лишь о том, что этот закон, возможно, не очень сильно 
отличается, в данном случае, от равномерного.
С другой стороны, справедливая гипотеза 
0
H
может быть отклонена и 
эти самым совершена ошибка 1-го рода. При проверке гипотез вероятность ошибки 1-го рода α (уровень значимости), как правило, задают, 
допуская тем самым возможность отклонения 
0
H
и возможность такой 
ошибки.
При построении критериев стремятся к использованию одномерных 
статистик, что упрощает построение критической области. При этом критерии могут быть правосторонними, левосторонними и двусторонними, 
что определяет построение критической области.
Все критерии согласия являются правосторонними, и проверяемая гипотеза 
0
H
отклоняется при больших значениях статистики. Среди специальных критериев проверки равномерности присутствуют правосторонние 
и двусторонние. 
В случае правостороннего критерия граница критической области 
(критическое значение) 
1S
α
 , определяется уравнением

1

0
1
0
(
)
1
(
)

S
g s H
ds
G S
H

α

α
α







 

,
(1.1)

где 
0
(
)
g s H
− условная плотность распределения статистики при спра
ведливости 
0
H . 
Для используемых на практике критериев в благоприятных случаях 
известны асимптотические (предельные) распределения 
0
(
)
G S H
соот
ветствующих статистик при условии справедливости гипотезы 
0
H . В тех 
ситуациях, когда распределения статистик существенно зависят от объёмов выборок n , информация о законе распределения статистики бывает 
представлена таблицей процентных точек (квантилей распределения 

0
(
)
G S H
). Критическое значение 
1S
α

вычисляют в соответствии с 

0
(
)
G S H
или берут из соответствующей таблицы процентных точек. 

В случае правостороннего критерия в принятой практике статистического анализа обычно полученное значение статистики 

*
S
сравнивают с 

К покупке доступен более свежий выпуск Перейти