Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Математическая статистика : проверка гипотезы о виде закона распределения

Покупка
Артикул: 752805.01.99
Доступ онлайн
2 000 ₽
В корзину
Настоящее издание содержит описание индивидуального задания (лабораторной работы) по теме «Проверка гипотезы о виде закона распределения». В первом разделе приведены необходимые для выполнения работы теоретические сведения. Во втором разделе изложено подробное решение четырех различных вариантов. Далее представлены варианты индивидуальных заданий. Предназначен для студентов всех направлений подготовки.
Данченков, И. В. Математическая статистика : проверка гипотезы о виде закона распределения : практикум / И. В. Данченков, В. А. Карасев. - Москва : Изд. Дом НИТУ «МИСиС», 2017. - 54 с. - ISBN 978-5-906846-83-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/1230540 (дата обращения: 19.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ 

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ  
ВЫСШЕГО ОБРАЗОВАНИЯ  
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» 

ИНСТИТУТ БАЗОВОГО ОБРАЗОВАНИЯ 

 

 
 
 

 

 

 

 
 

 

№ 2976 

Кафедра математики

И.В. Данченков 
В.А. Карасев 
 

Математическая статистика

Проверка гипотезы о виде закона 
распределения 

Практикум 

Рекомендовано редакционно-издательским 
советом университета 

Москва  2017 

УДК 519.2 
 
Д17 

Р е ц е н з е н т  
канд. экон. наук, проф. В.Ф. Михин 

Данченков И.В. 
Д17  
Математическая статистика : проверка гипотезы о виде закона распределения : практикум / И.В. Данченков, В.А. Карасев. – М. : Изд. Дом НИТУ «МИСиС», 2017. – 54 с. 
ISBN 978-5-906846-83-9 

Настоящее издание содержит описание индивидуального задания (лабораторной работы) по теме «Проверка гипотезы о виде закона распределения». В 
первом разделе приведены необходимые для выполнения работы теоретические сведения. Во втором разделе изложено подробное решение четырех различных вариантов. Далее представлены варианты индивидуальных заданий. 
Предназначен для студентов всех направлений подготовки. 

УДК 519.2 

 
 
ISBN 978-5-906846-83-9 

 И.В. Данченков, 
В.А. Карасев, 2017 
 НИТУ «МИСиС», 2017 

СОДЕРЖАНИЕ 

1. Краткие теоретические сведения ...................................................... 4 
1.1. Основные понятия математической статистики ...................... 4 
1.2. Статистические оценки параметров распределения ................ 6 
1.3. Проверка статистических гипотез ............................................. 8 
2. Примеры выполнения индивидуальных заданий ............................ 13 
Пример 1 ............................................................................................. 13 
Пример 2 ............................................................................................. 20 
Пример 3 ............................................................................................. 27 
Пример 4 ............................................................................................. 33 
3. Варианты индивидуального задания ................................................ 41 
Литература .............................................................................................. 44 
Приложение 1. Основные законы распределения ............................... 45 
Приложение 2. Значения функции Ф(х) ............................................... 49 
Приложение 3. Квантили хи-квадрат распределения 
 
2
p k

 ............ 51 

 

1. КРАТКИЕ ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ 

1.1. Основные понятия 
математической статистики 

Математическая статистика – это раздел математики, в котором 
изучаются математические методы систематизации, обработки и использования статистических данных для научных и практических 
выводов. 
Если используемая совокупность объектов состоит из очень 
большого их числа, то провести сплошное её обследование практически невозможно. 
Выборкой называется серия повторных измерений случайной величины, извлечённая из генеральной совокупности. 
Генеральной совокупностью называется множество (гипотетическое) всех возможных результатов измерения некоторой величины, 
которые могут быть получены в данных условиях. 
Объёмом совокупности называется число объектов этой совокупности. 
Пусть для изучения количественного признака X из генеральной 
совокупности извлечена выборка: x1 (наблюдалась n1 раз), x2(n2), … , 

xm(nm), тогда 

1

m

i
i
n
n





 – объём выборки. 

Вариантами называются наблюдаемые значения xi признака X. 
Вариационным рядом называется последовательность вариант, 
записанных в возрастающем порядке. 
Частотами называются числа наблюдений ni. 
Относительными частотами называются отношения частот к 
объёму выборки: 

 
.
i
i
n
w
n 
 

Статистическим распределением выборки называется перечень 
вариант xi вариационного ряда и соответствующих им частот ni или 
относительных частот wi. 
В статистическом распределении выборки сумма всех частот равна 
объёму выборки n, а сумма всех относительных частот равна единице. 

Статистическое распределение выборки является эмпирическим аналогом распределения случайной величины в теории вероятностей. 
Простым статистическим рядом называется таблица статистического распределения выборки. 
Если число измерений является большим, то для удобства анализа 
статистического материала производится его группировка: весь интервал полученных значений величины X разбивается на l равных 
частичных интервалов 
1
[
;
)
k
k
x
x

 длиной h каждый. 
Если ni – частота случайной величины, попадающей в i-й интервал, то 

i
i
n
w
n

 – относительная частота, соответствующая интервалу 

1;
i
i
x
x

. 

Если X – непрерывная случайная величина, то её эмпирический закон распределения может быть представлен гистограммой частот, т.е. 
эмпирическим аналогом плотности распределения (плотности вероятности) непрерывной случайной величины в теории вероятностей. 
Гистограммой частот называется ступенчатая фигура, состоящая 
из прямоугольников, основаниями которых служат частичные интер
валы длиной h, а высоты равны отношению 
in
h  (плотность частоты). 

Площадь гистограммы частот равна сумме всех частот, т.е. объёму выборки n. 
Гистограммой относительных частот называется ступенчатая 
фигура, состоящая из прямоугольников, основаниями которых слу
жат частичные интервалы длиной h, а высоты равны отношению 
iw
h  

(плотность относительной частоты). 
Площадь гистограммы относительных частот равна сумме всех 
относительных частот, т.е. единице. 
Эмпирический закон распределения для случайной величины X 
(непрерывной или дискретной) можно записать, а также графически 
изобразить по её вариационному ряду и с помощью эмпирической 
функции распределения.  
Эмпирической функцией распределения (функцией распределения выборки) называется функция F(x), определяющая для каждого значения x относительную частоту события X < x: 

 
 
,
xn
F x
n

 

где nx – число вариант, меньших x; 
n – объём выборки. 

Свойства функции F(x): 
1) 
 
0
1
F x

 ; 

2) 
 
F x  – неубывающая функция; 
3) если x1 – наименьшая варианта, xm – наибольшая варианта, то 
 
0
F x 
 при 
1
x
x

 и 
 
1
F x   при 
m
x
x

. 

1.2. Статистические оценки параметров 
распределения 

Пусть изучается количественный признак генеральной совокупности, и путём определённых обоснований устанавливается, какое 
именно распределение (предположительно) имеет этот признак. После этого необходимо оценить параметры, определяющие это распределение (например, математическое ожидание a и среднее квадратическое отклонение , если распределение нормальное, или параметр  , если распределение Пуассона и т.п.). 
При исследовании имеются лишь данные выборки, через эти данные и надо выразить оцениваемый параметр, т.е. надо найти функцию от наблюдаемых случайных величин (например, для оценки математического ожидания какого-либо признака случайной величины 
такой функцией служит среднее арифметическое наблюдаемых значений признака). 
Статистической оценкой неизвестного параметра теоретического распределения называется функция от наблюдаемых случайных величин. 
Точечной оценкой называется статистическая оценка, которая 
определяется одним числом. 
Несмещённой называется точечная оценка, математическое ожидание которой равно оцениваемому параметру при любом объёме 
выборки. Иначе говоря, несмещённость означает отсутствие систематической ошибки (т.е. ошибки одного и того же знака) при повторных применениях алгоритма. 
Смещённой называется точечная оценка, математическое ожидание которой не равно оцениваемому параметру. 
Несмещённой оценкой генеральной средней (математического 
ожидания) служит выборочная средняя 

1

1
,

m

i
i
i

x
n x
n

 
 
(1.1) 

где 
ix   варианта выборки; 

in  частота варианты 
ix ; 
п – объём выборки.  

Смещённой оценкой генеральной дисперсии служит выборочная 
дисперсия 

 


2
в
1

1
.

m

i
i
i
D
n
x
x
n




 
 (1.2) 

Если первоначальные варианты не являются равноотстоящими, а весь 
интервал поделён на несколько равных частичных интервалов длиной h, 
то при вычислении выборочной дисперсии для уменьшения ошибки, вызванной группировкой (особенно при малом числе интервалов), делают 
поправку Шеппарда, т.е. дисперсия вычисляется по формуле 

 
2
в
в
1
.
12
D
D
h
 

 

Несмещённой оценкой генеральной дисперсии служит исправленная выборочная дисперсия 
2
S : 

 
2
в
1
n
S
D
n


. 
 (1.3) 

Оценкой среднего квадратического отклонения σ при этом является величина 

 
2 .
S
S

 
 (1.4) 

При выборке малого объёма точечная оценка может значительно 
отличаться от оцениваемого параметра. 
При статистической обработке результатов наблюдений также 
определяют точность полученной оценки параметра. 
Интервальной называется оценка, которая определяется двумя числами – концами интервалов, перекрывающими оцениваемый параметр. 
Пусть  – неизвестный параметр, 
*
  – статистическая характеристика, найденная по данным выборки. 

Надёжностью (доверительной вероятностью) оценки  по 
*
  называется вероятность p, с которой осуществляется неравенство 

*
     . 

Положительное число   характеризует точность оценки. 
При исследованиях надёжность оценки задаётся наперёд и в качестве 
p берётся число, близкое к единице (чаще всего 0,95; 0,99; 0,999). 
Доверительным называется интервал 

*
*
;
      , который 

покрывает неизвестный параметр с заданной надёжностью p. 

1.3. Проверка статистических гипотез 

Пусть интересующий нас закон распределения генеральной совокупности неизвестен, но имеются основания предположить, что он 
имеет определённый вид (обозначим его А). Выдвигается гипотеза: 
генеральная совокупность распределена по закону А. 
Статистической называется гипотеза о виде неизвестного распределения, или о параметрах известных распределений. 
Нулевой (основной) называется выдвинутая гипотеза H0. 
Конкурирующей (альтернативной) называется гипотеза H1, которая противоречит нулевой (основной). 
Выдвинутая гипотеза может быть правильной или неправильной, 
поэтому есть необходимость её проверять. Проверка производится 
статистическими методами, поэтому её называют статистической. В 
итоге проверки гипотезы может быть принято неправильное решение, т.е. допущены ошибки. 
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода называется 
уровнем значимости и обозначается через  . 
Уровень значимости критерия полагается достаточно малым 
(0,05; 0,01; и т.п.). 
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначается через . 
Для проверки гипотезы подбирается случайная величина K, называемая статистическим критерием (или просто критерием). Наблюдаемым (эмпирическим) значением Kнабл называется то значение 
критерия, которое вычислено по выборкам. 

Подбирается также некоторый интервал (или совокупность нескольких интервалов) значений критерия K, называемый областью 
принятия гипотезы Н0 (областью допустимых значений). 
Критической областью называется совокупность значений критерия, при которой нулевая гипотеза отвергается. 
Основной принцип проверки статистических гипотез заключается в следующем: если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают, если 
оно принадлежит области принятия гипотезы, то нулевую гипотезу принимают. 
Критическими точками (границами) Kкр называются точки, отделяющие критическую область от области принятия гипотезы. Для 
отыскания критической области задаются уровнем значимости   и 
ищут критические точки из условий: 
1) Р(K > Kкр)=   при Kкр > 0 – для правосторонней критической области; 
2) Р(K < Kкр) =   при Kкр < 0 – для левосторонней критической 
области; 

3) Р(K > Kкр) = 2

  при Kкр > 0, Р(K < Kкр) = 2

  при Kкр > 0 – для 

двусторонней симметричной области. 
При отыскании критической области в некоторых случаях удобнее 
рассматривать вероятность попадания в неё критерия при условии, что 
нулевая гипотеза неверна и, следовательно, справедлива конкурирующая. 
Мощностью критерия называется вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. 
Более подробно об основных понятиях теории вероятности и математической статистики можно прочитать в пособиях [1, 2]. 

1.3.1. Проверка гипотезы о нормальном 
распределении генеральной совокупности  

Эмпирическое распределение задано в виде последовательности l 
интервалов 
1
[
;
)
k
k
x
x 
, k = 1, 2, …, l одинаковой длины и соответствующих им частот. В этом случае надо: 
1) вычислить выборочную среднюю x  и выборочное среднее 
квадратическое отклонение S, причём в качестве вариант 
*
ix  принять 

среднее арифметическое концов каждого интервала 
*
1
2

i
i
i

x
x
x



;  

2) вычислить теоретические частоты 
i
i
n
nP
 
,  
где n  – объём выборки; 

iP  – вероятность попадания X в интервал 

1
;
i
i
x x 
; 

 


 
1
i
i
i
P
x
x

 
 
, 
 (1.5) 

где 
 
x

 – функция Лапласа (см. табл. П2 в прил. 2); 

3) сравнить эмпирические и теоретические частоты с помощью 
критерия Пирсона. Для этого надо: 
а) найти наблюдаемое значение критерия 

 



2
2
набл
1

l
i
i

i
i

n
nP

nP





 
 (1.6) 

(его удобнее находить, составив расчётную таблицу); 
б) найти критическую точку 
 

2
2
кр
1
k


 
 правосторонней крити
ческой области по таблице критических точек распределения 
2
 , где 
  – заданный уровень значимости; k – число степеней свободы. Для 
нормального распределения 
3
k
l
 
, где l – число групп выборки. 
Если окажется, что 
2
2
набл
кр

 
, то нет оснований отвергнуть гипо
тезу о нормальном распределении генеральной совокупности. 
Если 
2
2
набл
кр

 
 – гипотеза отвергается (так как это неравенство озна
чает, что эмпирические и теоретические частоты различаются значимо). 

1.3.2. Проверка гипотезы о показательном 
распределении генеральной совокупности  

Для того чтобы по уровню значимости   проверить гипотезу о 
том, что непрерывная случайная величина распределена по показательному закону, надо: 
1) найти по заданному эмпирическому распределению случайной 
величины X выборочную среднюю x . 
В качестве «представителя» i-го интервала принимается его сере
дина 
*
1
2

i
i
i

x
x
x



 и составляется последовательность равноотстоя
щих вариант и соответствующих им частот 
in ; 

2) принять в качестве оценки параметра   показательного распределения величину, обратную выборочной средней: 

 
*

в

1
x
 
; 
(1.7) 

3) найти вероятность попадания X в частичные интервалы 
1
[
;
)
i
i
x
x 
 
по формуле 

 


1
1
i
i
x
x
i
i
i
P
P x
X
x
e
e









; 
(1.8) 

4) вычислить теоретические частоты 

 
i
i
n
nP
 
,  

где 

1

l

i
i
n
n



– объём выборки; 

5) сравнить эмпирические и теоретические частоты с помощью 
критерия Пирсона. 
При этом число степеней свободы 
1
2
k
l
r
l
  
 
, так как показательное распределение определяется одним параметром   и этот 
параметр оценивается по выборке, т.е. 
1
r  ; l – число интервалов. 

1.3.3. Проверка гипотезы о равномерном 
распределении генеральной совокупности 

Для этого надо: 
1) оценить параметры a и b – концы интервала, в котором наблюдались возможные значения X, по формулам 

 
*
3
a
x
S


, 
*
3
b
x
S


 , 
(1.9) 

где 
*
a  и 
*
b  – оценки параметров; 

2) найти дифференциальную функцию (плотность вероятности) 
предполагаемого распределения 

 
 
*
*
1
f x
b
a




;  
(1.10) 

3) найти теоретические частоты: 

Доступ онлайн
2 000 ₽
В корзину