Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Непараметрические критерии согласия

Руководство по применению
Покупка
Основная коллекция
Артикул: 288500.05.01
К покупке доступен более свежий выпуск Перейти
Книга рассчитана на специалистов, сталкивающихся в своей деятельности с вопросами статистического анализа данных или с необходимостью выбора модели закона распределения, адекватно описывающего наблюдаемые случайные величины. В руководстве рассматриваются вопросы применения непараметрических критериев согласия (Колмогорова, Купера, Крамера - Мизеса - Смирнова, Ватсона, Андерсона - Дарлинга, Жанга) при проверке простых и сложных гипотез. В приложении приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев при проверке простых и, главное, различных сложных гипотез. Следование рекомендациям обеспечит корректность статистических выводов при анализе данных с использованием непараметрических критериев согласия. Книга будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), сталкивающимся в своей деятельности с необходимостью статистического анализа результатов экспериментов. Руководство будет полезно преподавателям вузов, аспирантам и студентам.
Тематика:
ББК:
УДК:
ОКСО:
ГРНТИ:
Лемешко, Б. Ю. Непараметрические критерии согласия: руководство по применению / Б.Ю. Лемешко. — Москва : ИНФРА-М, 2019. — 163 с. - ISBN 978-5-16-010003-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/1020038 (дата обращения: 20.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Москва

ИНФРА-М

201Министерство образования и науки Российской Федерации

Новосибирский государственный технический университет

НЕПАРАМЕТРИЧЕСКИЕ 
КРИТЕРИИ СОГЛАСИЯ

РУКОВОДСТВО ПО ПРИМЕНЕНИЮ

Б.Ю. ЛЕМЕШКО

УДК 519.23(076.5)
ББК 22.172я7
 
Л44

Рецензенты:

Попов А.А. — д-р техн. наук, профессор;
Селезнев В.А. — д-р физ.-мат. наук, профессор

Лемешко Б.Ю.

Непараметрические критерии согласия: руководство по 

применению / Б.Ю. Лемешко. —  М. : ИНФРА-М, 2019. — 163 с.

ISBN 978-5-16-010003-6 (print)
ISBN 978-5-16-101674-9 (online)

Книга рассчитана на специалистов, сталкивающихся в своей деятельности 

с вопросами статистического анализа данных или с необходимостью выбора модели закона распределения, адекватно описывающего наблюдаемые случайные 
величины.

В руководстве рассматриваются вопросы применения непараметрических 

критериев согласия (Колмогорова, Купера, Крамера – Мизеса – Смирнова, Ватсона, Андерсона – Дарлинга, Жанга) при проверке простых и сложных гипотез.

В приложении приводятся таблицы, содержащие процентные точки и моде
ли распределений статистик, необходимые для корректного применения критериев при проверке простых и, главное, различных сложных гипотез.

Следование рекомендациям обеспечит корректность статистических выводов 

при анализе данных с использованием непараметрических критериев согласия.

Книга будет полезна инженерам, научным сотрудникам, специалистам раз
личного профиля (медикам, биологам, социологам, экономистам и др.), сталкивающимся в своей деятельности с необходимостью статистического анализа 
результатов экспериментов. Руководство будет полезно преподавателям вузов, 
аспирантам и студентам.

УДК 519.23(076.5)

ББК 22.172я7

©  Лемешко Б.Ю., 2014

Л44

ISBN 978-5-16-010003-6 (ИНФРА-М, print)
ISBN 978-5-16-101674-9 (ИНФРА-М, online)

3

Оглавление 

Предисловие .......................................................................................5
1. Введение ..........................................................................................7
2. Непараметрические критерии согласия  при проверке простых 
гипотез ...............................................................................................12

2.1. Критерий Колмогорова .................................................................. 12
2.2. Критерий Смирнова ....................................................................... 13
2.3. Критерий Крамера-Мизеса-Смирнова ......................................... 14
2.4. Критерий Андерсона-Дарлинга .................................................... 16
2.5. Критерий Купера ............................................................................ 16
2.6. Критерий Ватсона .......................................................................... 18
2.7. Критерии Жанга ............................................................................. 21
2.8. Проверка простых гипотез ............................................................ 22

2.8.1. Порядок проверки простой гипотезы .................................... 22
2.8.2. Проверка простой гипотезы по критерию Колмогорова ..... 23
2.8.3. Проверка простой гипотезы по критерию Смирнова .......... 23
2.8.4. Проверка простой гипотезы по критерию 2 Крамера–
Мизеса–Смирнова ............................................................................. 23
2.8.5. Проверка простой гипотезы по критерию 2 Андерсона–
Дарлинга............................................................................................. 24
2.8.6. Проверка простой гипотезы по критерию Купера ............... 24
2.8.7. Проверка простой гипотезы по критерию Ватсона ............. 25
2.8.8. Проверка простой гипотезы по критериям Жанга ............... 25

3. Непараметрические критерии согласия  при проверке сложных 
гипотез ...............................................................................................27

3.1. Факторы, влияющие на распределения статистик критериев при 
проверке сложных гипотез ................................................................... 27
3.2. Методы оценивания параметров распределений и зависимость 
от них распределений статистик критериев ....................................... 28
3.3. Зависимость распределений статистик непараметрических 
критериев от вида закона ...................................................................... 31
3.4. Зависимость распределений  статистик непараметрических 
критериев  от числи и типа оцениваемых параметров ...................... 32

4

3.5. Зависимость распределений  статистик непараметрических 
критериев  от конкретных значений параметра ................................. 34
3.6. Выводы ............................................................................................ 42

4. Проверка сложных гипотез .........................................................44

4.1. Порядок проверки сложной гипотезы .......................................... 44
4.2. Перечень распределений, для которых  регламентирована 
проверка сложных гипотез ................................................................... 46
4.3. Примеры применения критериев согласия  при простых и 
сложных гипотезах ................................................................................ 53
4.4. Некоторые замечания к применению ........................................... 70

4.4.1. О мощности критериев ........................................................... 70
4.4.2. О типичных ошибках применения ........................................ 72

5. О решении проблем проверки сложных гипотез ......................74

5.1. Развитие ситуации .......................................................................... 74
5.2. Методика компьютерного анализа  статистических 
закономерностей ................................................................................... 76
5.3. Интерактивный подход к проверке гипотез в нестандартных 
условиях ................................................................................................. 79

6. Заключение ...................................................................................83
Библиографический список ............................................................85
Приложение A. Таблицы распределений статистик 
непараметрических критериев согласия при простых и сложных 
гипотезах ...........................................................................................94

5

Предисловие 

История применения непараметрических критериев согласия 

насчитывает ровно 80 лет, начиная с работы А.Н. Колмогорова [18], 
после которой был предложен еще ряд непараметрических критериев, 
ставших классическими, статистики которых обладают замечательным свойством “свободы от распределения” при проверке простых 
гипотез. Это свойство предопределило широкое использование этих 
критериев в приложениях при решении задач статистического 
анализа. 

Через 20 с небольшим лет стало известно о проблеме [17]. Если 

по анализируемой выборке оцениваются параметры закона распределения вероятностей, а затем по ней же проверяется согласие с 
данным законом с применением непараметрического критерия, то 
свойство “свободы от распределения” статистики этого критерия теряется. Распределения статистик непараметрических критериев согласия при проверке сложных гипотез оказываются совсем другими, 
нежели при проверке простых, и нельзя использовать классические 
результаты.  

С тех пор математическая статистика в своем развитии ушла 

далеко вперед, а проблема применения непараметрических критериев 
согласия при проверке сложных гипотез осталась.  

При этом множество специалистов, имеющих отношение к 

математической статистике и применению методов статистического 
анализа, условно можно разбить на два подмножества. К первому 
отнести специалистов в области математической статистики, которые 
знают о проблеме применения непараметрических критериев 
согласия при проверке сложных гипотез, но поглощенные своими 
задачами, не занимаясь анализом данных в приложениях, не 
используют эти критерии в своей деятельности. К другому 
подмножеству, которое несравненно больше, отнести тех, кто не 
знает об этой проблеме, но в своей практической деятельности, 
сталкиваясь с необходимостью статистического анализа результатов 
экспериментальных исследований, применяет непараметрические 
критерии согласия. При этом применяет, как правило, в условиях 

6

проверки сложных гипотез, опираясь на классические результаты, а,
следовательно, не корректно. Эти два подмножества специалистов 
практически не пересекаются. Более того, складывается ощущение, 
что доля первого подмножества относительно сокращается и это 
связано с тем, что в университетских курсах математической 
статистики о проблеме не упоминается.  

17 лет назад, когда нам стала известно о существовании этой 

проблемы и степени её решения, мы относились ко второму 
подмножеству, к той его части, которая не понимала, почему 
оценивая параметры и применяя непараметрические критерии 
согласия, мы никак не учитываем этого факта при принятии решения 
о результатах проверки гипотезы. Было откровением, что проблема 
давно известна, но далека от разрешения. 

Тогда, используя свои возможности и методы статистического 

моделирования, мы убедились, что можно строить приближенные 
модели, которые с достаточной точностью описывают распределения 
статистик критериев согласия при проверке различных сложных 
гипотез. На базе этих результатов были подготовлены рекомендации 
[93], а затем рекомендации по стандартизации Р 50.1.037–2002 [111]. 
Готовя рекомендации по стандартизации [111], мы очень надеялись, 
что следование им позволит снизить уровень некорректного 
применения критериев в приложениях. Ожидания не очень 
оправдались, но надежда остается. 

Данное руководство, которое на базе последующих исследований 

существенно уточняет и расширяет прежние результаты, призвано 
заменить рекомендации по стандартизации [111]. 

Я очень признателен своим ученикам и коллегам (Постовалову 

С.Н., Чимитовой Е.В., Лемешко С.Б., Волковой В.М., Рогожникову 
А.П., Горбуновой А.А.), сделавшим много для исследования распределений статистик критериев в условиях нарушения стандартных 
предположений и вносящим вклад в развитие компьютерных 
технологий исследования статистических закономерностей. 

Б.Ю. Лемешко 

Январь 2014 

7

1. Введение 

Целью первичной обработки экспериментальных наблюдений 

обычно является выбор закона распределения, наиболее хорошо 
описывающего случайную величину, выборку которой наблюдают. 
Насколько хорошо наблюдаемая выборка описывается теоретическим 
законом, проверяют с помощью различных критериев согласия. Цель 
проверки 
гипотезы 
о 
согласии 
опытного 
распределения 
с 

теоретическим – это стремление удостовериться в том, что данная 
модель теоретического закона не противоречит наблюдаемым данным, 
и использование ее не приведет к существенным ошибкам при вероятностных 
расчетах.
Некорректное 
использование 
критериев 

согласия может приводить к необоснованному принятию (чаще всего) 
или необоснованному отклонению проверяемой гипотезы. 

Проверка статистических гипотез о согласии эмпирических данных 

с теоретическим законом распределения обычно осуществляется с 

применением критериев типа 
2
  или непараметрических критериев.  

В 
данном 
руководстве 
говорится 
только 
о 
применении 

непараметрических критериев согласия, в частности, о применении 
критериев 
Колмогорова, 
Крамера-Мизеса-Смирнова, 
Андерсона
Дарлинга, 
Купера, 
Ватсона, 
Жанга. 
К 
сожалению, 
практика 

применения такого рода критериев в приложениях богата большим 
числом примеров некорректного использования. Нередко с такими 
примерами можно столкнуться в литературных источниках учебного 
характера. Наиболее распространенные ошибки применения связаны с 
использованием классических результатов, имеющих место при 
проверке простых гипотез, для ситуаций, соответствующих проверке 
сложных гипотез [72, 27].  

При проверке согласия различают простые и сложные гипотезы. 

Простая проверяемая гипотеза имеет вид 
0
H : 
( )
( , )
F x
F x

 , где 

( , )
F x   – функция распределения вероятностей, с которой проверяют 

8

согласие наблюдаемой выборки, а   – известное значение параметра 
(скалярного или векторного). 

Сложная проверяемая гипотеза имеет вид 
0
H : 


( )
( , ),
,
F x
F x

 

где   – область определения параметра  .  

Следует отметить, что если процесс вычисления оценки ˆ

скалярного или векторного параметра закона не опирается на ту же 
самую выборку, по которой проверяют гипотезу о согласии, то 
алгоритм применения критерия согласия при проверке сложной 
гипотезы не отличается от проверки простой гипотезы.  

Проблемы возникают, если при проверке сложной гипотезы оценку 

ˆ  параметра распределения вычисляют по той же самой выборке, по 
которой проверяют согласие. Далее, говоря о проверке сложных 
гипотез, мы, как правило, будем предполагать, что оценка параметра ˆ
вычисляется по той же выборке.  

Очевидно, что на практике при обработке результатов измерений с 

проблемой проверки сложных гипотез чаще всего сталкиваются 
именно в такой ситуации, поскольку сначала оценивают по выборке 
параметры модели, чтобы лучше подогнать ее к наблюдаемым данным, 
а потом проверяют адекватность полученной модели. 

Схема проверки гипотезы заключается в следующем.  
В соответствии с применяемым критерием согласия вычисляют 

значение 
*
S  статистики критерия S  как некоторой функции от 

выборки и теоретического закона распределения с плотностью 

0
( ,
)
F x 
 [или 
ˆ
( , )
F x   при сложной гипотезе]. Для используемых на 

практике критериев асимптотические (предельные) распределения 

0
(
)
G S H
 соответствующих статистик при условии истинности 

гипотезы 
0
H  обычно известны. Как правило, для ситуаций проверки 

простых и сложных гипотез эти распределения различаются.  

В ситуации проверки простых гипотез предельные распределения 

статистик классических непараметрических критериев согласия 
известны и не зависят от вида наблюдаемого закона распределения и, в 
частности, от его параметров. Говорят, что эти критерии являются 
«свободными от распределения». Это достоинство предопределило 
широкое использование данных критериев в различных приложениях. 

9

Далее в принятой практике статистического анализа обычно 

полученное значение статистики 
*
S  сравнивают с критическим 

значением S  при заданном уровне значимости  . Нулевую гипотезу 

отвергают, если 
*
S
S

 (рис. 1.1).  

g S  H
(
 )
 0

1 – 


S

S

*
S

Рис. 1.1. Плотность распределения статистики при истинной 

гипотезе 
0
H

Критическое значение S , определяемое в случае одномерной 

статистики из уравнения 

0
0
(
)
1
(
)

S

g s H
ds
G S
H






 
 

, 
(1.1) 

где 
0
(
)
g s H
 − условная плотность распределения статистики, обычно 

берут из соответствующей статистической таблицы или вычисляют. 

Больше информации о степени согласия можно почерпнуть из 

«достигаемого 
уровня 
значимости»: 
величины 
вероятности 

возможного превышения полученного значения статистики при 
истинности нулевой гипотезы  

*

*
*

0
0
{
}
(
)
1
(
)

S

P S
S
g s H
ds
G S H





 

. 
 
(1.2) 

10

Именно эта вероятность позволяет судить о том, насколько хорошо 
выборка согласуется с теоретическим распределением, так как по 
существу представляет собой вероятность истинности нулевой 
гипотезы (рис. 1.2). Гипотезу о согласии не отвергают, если 

*
{
}
P S
S

 .  

g S  H
(
 )
 0

S

S

*
S

P S
S  
{  > 
}
*

Рис. 1.2. Плотность распределения статистики при истинной  

гипотезе 
0
H  и достигаемый уровень значимости 

Задачи оценивания параметров и проверки гипотез опираются на 

выборки независимых случайных величин. Случайность самой выборки предопределяет, что возможны и ошибки в результатах 
статистических выводов. С результатами проверки гипотез связывают 
ошибки двух видов: ошибка первого рода состоит в том, что 
отклоняют гипотезу 
0
H , когда она верна; ошибка второго рода 

состоит в том, что принимают гипотезу 
0
H , в то время как 

справедлива конкурирующая гипотеза 
1
H . Уровень значимости 

задает вероятность ошибки первого рода. Обычно в критериях 
согласия не рассматривают конкретную конкурирующую гипотезу. И 
тогда можно считать, что конкурирующая гипотеза имеет вид 
1 :
H

0
( )
( ,
)
F x
F x


.  

11

Если же гипотеза 
1
H  задана и имеет, например, вид 
1 :
H

1
1
( )
( ,
)
F x
F x

 , то задание величины   для используемого критерия 

проверки гипотез определяет и вероятность ошибки второго рода 

1

0

(
)

S

g s H ds



  
. 
 (1.3) 

На рис. 1.3 
0
( |
)
g s H
 отображает плотность распределения 

статистики S  при истинности гипотезы 
0
H , а 
1
( |
)
g s H
 – плотность 

распределения при справедливости 
1
H .  

g S  H
(
 )
 0

g S  H
(
 )
 1

g S  H
(
 )
 i





1 – 

1 – 

S

S

Рис. 1.3. Плотности распределения статистик при 

справедливости гипотез 
0
H и 
1
H

Мощность критерия представляет собой величину 1 . Очевидно, 

что чем выше мощность используемого критерия при заданном 
значении  , тем лучше он различает гипотезы 
0
H
и 
1
H . Особенно 

важно, чтобы этот критерий хорошо различал близкие конкурирующие 
гипотезы. Графически требование максимальной мощности критерия 

означает, что на рис. 1.3 плотности 

0
|
g s H
и 

1
|
g s H
 должны быть 

максимально «раздвинуты». 

12

2. Непараметрические критерии согласия  

при проверке простых гипотез 

2.1. Критерий Колмогорова 

Критерий Колмогорова опирается на статистику  

sup
( )
( , )
n
n

x

D
F x
F x





 ,  
(2.1) 

где 
( )
n
F
x  – эмпирическая функция распределения; 
( , )
F x   – 

теоретическая функция распределения; 
n  – объем выборки. 

Предельное распределение этой статистики для случая проверки 
простой гипотезы было получено Колмогоровым в [18]. При n 

функция распределения статистики 
n
n D

 сходится равномерно к 

функции распределения Колмогорова  

2 2
2
( )
( 1)k
k s

k

K s
e









.  
(2.2) 

При проверке гипотез с применением критерия Колмогорова 

рекомендуется использовать статистику с поправкой Большева [63, 64] 
в форме [65] 

6
1
1

6
6

n

K
n

nD
S
nD

n
n





, 
 (2.3) 

где  



max
,
n
n
n
D
D
D



,  
(2.4) 

1
max
( , )
n
i
i n

i
D
F x

n



 











; 
(2.5) 

1

1
max
( , )
n
i
i n

i
D
F x

n



 





 





, 
 (2.6) 

К покупке доступен более свежий выпуск Перейти