Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Теория вероятностей и математическая статистика : математическая статистика

Покупка
Артикул: 752791.01.99
Доступ онлайн
2 000 ₽
В корзину
Практикум предназначен для подготовки к занятиям, контрольным работам и к выполнению лабораторных работ (типовых расчетов) по курсу «Теория вероятностей и математическая статистика» разделу «Математическая статистика». Изложение теоретического материала сопровождается большим количеством примеров решения типовых задач, дается подробное описание выполнения лабораторных работ (типовых расчетов), разбирается решение типовых вариантов контрольных работ. В заключение приводятся варианты контрольных работ с ответами. Предназначен для студентов всех направлений.
Карасев, В. А. Теория вероятностей и математическая статистика : математическая статистика : практикум / В. А. Карасев, Г. Д. Левшина. - Москва : Изд. Дом МИСиС, 2016. - 120 с. - ISBN 978-5-906846-01-3. - Текст : электронный. - URL: https://znanium.com/catalog/product/1230511 (дата обращения: 24.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ 

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ  
ВЫСШЕГО ОБРАЗОВАНИЯ  
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» 

 

 
 
 

 

 

 

 
 

 

№ 2770 

Кафедра математики

В.А. Карасев 
Г.Д. Лёвшина 
 

Теория вероятностей
и математическая статистика 

Математическая статистика 

Практикум 

Рекомендовано редакционно-издательским 
советом университета 

Москва  2016 

УДК 519.2 
 
К21 

Р е ц е н з е н т  
канд. экон. наук, проф. В.Ф. Михин 

Карасев В.А. 
К21  
Теория вероятностей и математическая статистика : математическая статистика : практикум / В.А. Карасев, Г.Д. Лёвшина. – 
М. : Изд. Дом МИСиС, 2016. – 120 с. 
ISBN 978-5-906846-01-3 

Практикум предназначен для подготовки к занятиям, контрольным работам и к выполнению лабораторных работ (типовых расчетов) по курсу «Теория вероятностей и математическая статистика» разделу «Математическая 
статистика». Изложение теоретического материала сопровождается большим 
количеством примеров решения типовых задач, дается подробное описание 
выполнения лабораторных работ (типовых расчетов), разбирается решение 
типовых вариантов контрольных работ. В заключение приводятся варианты 
контрольных работ с ответами. 
Предназначен для студентов всех направлений. 

УДК 519.2 

 
 В.А. Карасев, 
Г.Д. Лёвшина, 2016 
ISBN 978-5-906846-01-3 
 НИТУ «МИСиС», 2016 

СОДЕРЖАНИЕ 

Предисловие .................................................................................... 5 
1. Практические занятия по математической статистике ........... 6 
1.1. Первичная обработка результатов эксперимента и 
оценка основных параметров генеральной совокупности ..... 6 
1.2. Оценка математического ожидания  
по неравноточным измерениям .............................................. 12 
1.3. Оценка дисперсии по нескольким сериям  
экспериментов .......................................................................... 14 
1.4. Построение гистограммы распределения ....................... 16 
1.5. Некоторые используемые в статистике  
распределения .......................................................................... 17 
1.6. Построение доверительных интервалов ......................... 20 
1.6.1. Доверительный интервал для математического 
ожидания .............................................................................. 21 
1.6.2. Доверительный интервал для среднего 
квадратического отклонения .............................................. 21 
1.6.3. Доверительный интервал для дисперсии ................ 22 
1.7. Проверка статистических гипотез ................................... 25 
1.7.1. Основные понятия ..................................................... 25 
1.7.2. Проверка гипотез о дисперсии нормального 
распределения ...................................................................... 29 
1.7.3. Проверка гипотез о математических ожиданиях 
нормального распределения ............................................... 35 
1.7.4. Проверка гипотезы о виде распределения 
генеральной совокупности ................................................. 43 
1.8. Регрессионный анализ. Построение линейной 
и квадратичной регрессионных моделей ............................... 46 
1.8.1. Оценка коэффициентов регрессии .......................... 46 
1.8.2. Проверка гипотезы об адекватности  
регрессионной модели ........................................................ 49 
1.8.3. Построение доверительных интервалов 
для коэффициентов регрессии ........................................... 50 
1.8.4. Задача регрессии для линейной функции ............... 51 
1.8.5. Задача регрессии для квадратичной функции ........ 53 

1.9. Линейный корреляционный анализ ................................ 62 
1.9.1. Двумерный случайный вектор, его выборочные 
характеристики .................................................................... 62 
1.9.2. Построение доверительного интервала 
для коэффициента корреляции. Проверка гипотезы о 
существовании линейной зависимости ............................. 68 
2. Указания по выполнению типовых расчетов  
(лабораторных работ) «Обработка основных типов 
экспериментальных данных» ....................................................... 71 
2.1. Типовой расчет 1. Сравнение двух случайных выборок 
(первичная обработка данных, проверка статистических 
гипотез) ..................................................................................... 71 
2.1.1. Первичная обработка результатов измерений ........ 72 
2.1.2. Построение доверительных интервалов ................. 73 
2.1.3. Проверка гипотез о равенстве дисперсий, 
о равенстве математических ожиданий ............................ 73 
2.1.4. Проверка гипотезы о нормальном распределении 
объединения двух случайных выборок ............................. 77 
2.1.5. Построение гистограмм распределения 
объединения двух случайных выборок ............................. 81 
2.2. Типовой расчет  2. Обработка данных методами 
регрессионного анализа ........................................................... 84 
2.2.1. Задача 1 ....................................................................... 85 
2.2.2. Задача 2 ....................................................................... 89 
2.3. Типовой расчет 3. Обработка данных методами 
линейного корреляционного анализа ..................................... 96 
2.3.1. Нахождение оценок числовых характеристик 
двумерного случайного вектора.  Расчет оценки 
коэффициента корреляции ................................................. 96 
2.3.2. Нахождение уравнений линейной регрессии ......... 97 
2.3.3. Построение доверительного интервала 
для коэффициента корреляции .  Проверка гипотезы  
о существовании линейной зависимости между 
величинами X и Y ................................................................. 97 
2.4. Примерные варианты контрольной работы ................... 97 
Библиографический список ....................................................... 106 
Приложение ................................................................................. 107 

ПРЕДИСЛОВИЕ 

Пособие является продолжением практикума «Теория вероятностей и математическая статистика» раздел «Теория вероятностей» 
(библ. № 2454), вышедшего в 2015 г. В нем приведены необходимые 
сведения об основных современных методах математической статистики и обработки экспериментальных данных на примерах, заимствованных из области металлургии, металловедения и экономики. 
Математическая статистика – это наука, которая методами теории 
вероятностей на основании результатов наблюдений изучает закономерности в массовых случайных явлениях. Математическая статистика (не путать со статистикой – разделом экономической теории) 
указывает способы сбора и группировки статических данных (результатов наблюдений или экспериментов), разрабатывает методы их 
обработки для оценки характеристик распределения, для установления зависимости случайной величины от других, для проверки статистических гипотез о виде распределения или значениях его параметров. Математическая статистика возникла и развивалась параллельно с теорией вероятностей. 
Данный практикум адресуется студентам всех специальностей 
НИТУ «МИСиС». Практикум подготовлен в соответствии с требованиями государственных образовательных стандартов. Рассматриваются следующие разделы курса: основные выборочные характеристики, точечные и интервальные оценки, проверка статистических 
гипотез, регрессионный и корреляционный анализ. 

Согласно учебному плану предусмотрено выполнение трех типо
вых расчетов (лабораторных работ). Исходя из этого сформирована 
структура практикума, состоящая из двух разделов. Первый содержит теоретический материал и методические указания по решению 
задач для подготовки к практическим занятиям. Приведены необходимые для решения задач понятия и формулы, рассмотрено большое 
количество примеров решения типовых задач, охватывающих основные темы курса математической статистики. 

Во второй части практикума разбираются все три типовые расче
ты (лабораторные работы), приводятся подробные примеры их выполнения. Затем даны типовые варианты контрольной работы с ответами. В приложении представлены статистические таблицы, необходимые для решения данных задач. 

Студентам, желающим ознакомиться с более полным и строгим 

изложением основ математической статистики, рекомендуем литературу, приведенную в библиографическом списке. 

1. ПРАКТИЧЕСКИЕ ЗАНЯТИЯ 
ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ 

1.1. Первичная обработка результатов эксперимента 
и оценка основных параметров генеральной 
совокупности 

Математическая статистика позволяет с помощью математических методов обрабатывать, систематизировать и использовать 
численные результаты эксперимента для получения практических 
выводов. 
Под генеральной совокупностью в математической статистике 
понимается множество (гипотетическое) всех возможных результатов измерения некоторой величины, которые могут быть получены в 
данных условиях. Тем же самым понятием в теории вероятностей 
является случайная величина Х. 
Реальная серия повторных измерений этой величины х1, х2,..., хn 
трактуется как случайная выборка из генеральной совокупности, или 
просто случайная выборка. Число n называется объемом случайной 
выборки. Приведем примеры. 
1. Проведена серия повторных измерений одной и той же физической величины в одних и тех же условиях. Разброс результатов обусловлен погрешностью измерительной аппаратуры. 
2. Измеряется некоторая характеристика одинаковых изделий, изготовленных при поточном производстве. Разброс результатов обусловлен особенностями технологии производства. 
3. Измеряется некоторая характеристика людей определенного 
пола и интервала возрастов, например рост. Разброс результатов обусловлен природными факторами. 
В статистике принята следующая математическая модель подобных экспериментов. Каждый элемент случайной выборки рассматривается как отдельная случайная величина. Относительно этих 
случайных величин, которые в дальнейшем будем обозначать прописными буквами, известна некоторая априорная информация. 
Случайная выборка называется повторной, если все входящие в 
нее случайные величины 
1
2
,
,...,
n
X
X
X  взаимно независимы и имеют 
одинаковую функцию распределения 
( )
F x , причем ту же, что и 
наблюдаемая случайная величина Х. На практике это, в частности, 
означает, что измерения производятся независимо друг от друга (по
лученные результаты одних измерений не влияют на возможные результаты других). Величины имеют одинаковые математические 
ожидания 
(
)
i
M X
a
=
, т.е., результаты измерений свободны от систематических ошибок (результаты в среднем не смещены относительно истинного значения 
(
)
M X
a
=
), и одинаковые дисперсии 

2
(
)
(
)
i
D X
D X

=
=
, что называется равноточностью измерений 
(например, измерения физической величины проведены на одном и 
том же приборе при одинаковых условиях). 
Если случайные величины 
1
2
,
,...,
n
X
X
X , образующие повторную 
случайную выборку, имеют нормальное распределение с одинаковыми параметрами а,  , т.е., Хi  N(a; ), то такая выборка называется нормальной, а соответствующая генеральная совокупность – нормальной генеральной совокупностью. 
В математической статистике рассматривают и неповторные выборки, в которых нарушается хотя бы одно из указанных условий: взаимная независимость, одинаковость функции распределения. Слово 
«повторная» обычно опускается, и пишут просто «выборка». Для 
неповторной выборки обязательно пишут «неповторная выборка». 
Распределение случайной величины X характеризуется рядом параметров (математическое ожидание, дисперсия и т.д.). Эти параметры называют параметрами генеральной совокупности. Важной 
задачей математической статистики является нахождение по случайной выборке приближенных значений каждого из параметров, называемых точечными оценками параметров, или просто оценками. Таким 
образом, 
оценкой 
параметра 
 называется 
функция 

1
2
(
,
,...,
)
n
f X
X
X
от случайной выборки, значение которой принимается в качестве приближенного для данного параметра и обозначается  : 

 
1
2
(
,
,...,
)
n
f X
X
X


»
=
. 
(1.1) 

Так как оценка зависит от случайной выборки, то она, в свою очередь, является случайной величиной. Для одного и того же параметра 
  по одной и той же выборке можно построить много различных 
оценок. Для сравнения оценок между собой введены специальные 
характеристики. 
Оценка называется несмещенной, если ее математическое ожидание 
равно истинному значению параметра, т.е. 
( )
M 

 =
. Несмещенная 

оценка обеспечивает близость в среднем значений оценки к значению 
оцениваемого параметра, т.е. не дает систематической ошибки. 
Оценка называется состоятельной, если при n  ¥  она сходится 
по вероятности к истинному значению оцениваемого параметра, т.е. 

 
0

" >  lim
(
)
0
n
n
P 



¥
>
=
, 
(1.2) 

где 

n
  – оценка параметра  , найденная по выборке объема n. 
Смысл понятия состоятельности заключается в том, что с увеличением объема выборки оценка стремится к истинному значению 
параметра. 

Точностью оценки   называется средний квадрат отклонения 

оценки от  : 
2
2
( )
[(
) ]
q
M





=
. Для несмещенных оценок точ
ность определяется величиной дисперсии оценки: 
2( )
( )
q
D




=
. Чем 

меньше 
2( )
q
q

=
, тем оценка лучше (точнее). Наилучшей линейной 
оценкой параметра   называется такая его линейная несмещенная 
оценка, которая имеет наименьшую дисперсию в классе всех линейных несмещенных оценок. 
Пусть задана повторная случайная выборка 
1
2
,
,
,
n
X
X
X

. За 
оценку математического ожидания a  принимается среднее арифметическое элементов выборки: 

 

1

1
n

i
i

X
X
n
=
= å
. 
(1.3) 

Оценкой дисперсии 
2
  при известном математическом ожидании a  является величина 
2
0
S : 

 
2
2
0
1

1
(
)

n

i
i
S
X
a
n
=
=
å
. 
(1.4) 

Оценкой дисперсии 
2
  при неизвестном математическом ожидании является величина 
2
S , которую называют эмпирической дисперсией: 

 
2
2

1

1
(
)
1

n

i
i
S
X
X
n
=
=
- å
. 
(1.5) 

Оценкой среднего квадратического отклонения   при этом являются, соответственно, величины 

 
2
0
0
S
S
=
;   
2
S
S
=
. 
(1.6) 

Оценки математического ожидания и дисперсии, найденные по 
формулам (1.3) – (1.5), являются несмещенными и состоятельными. 
Среднее арифметическое (1.3) является наилучшей линейной оценкой математического ожидания для повторной случайной выборки.  

Оценка параметра 
2


=
 с помощью значений (1.6) является 
состоятельной, но смещенной (ее смещение убывает с увеличением 
n). Число k = n – 1 в формуле (1.5) называется числом степеней свободы оценки 
2
S . 
Для практических расчетов формулу (1.5) удобно преобразовать к 
виду 

 

2
2
2

1

1
1

n

i
i
S
X
nX
n
=

æ
ö÷
ç
÷
=
ç
÷
ç
÷
ç
è
ø
å
. 
(1.7) 

Вычисление среднего значения X  и оценки дисперсии 
2
S  упрощается, если отсчет значений 
i
X  вести от подходящим образом выбранных начала отсчета С и масштабного коэффициента h, т.е. если 
сделать линейную замену: 
 
1, 2, ...,
(
)
i
i
X
C
hU
i
n
=
+
=
. 
(1.8) 

При такой замене формулы (1.3) и (1.5) – (1.6) принимают вид 

 

1

1
,

n

i
i

X
C
hU
U
U
n
=
=
+
= å
; 
(1.9) 

 
(
)

2
2
2
2
2
2

1
1
1
1

n
n

i
i
i
i

h
h
S
U
U
U
nU
n
n
=
=

æ
ö÷
ç
÷
=
=
ç
÷
ç
÷
ç
è
ø
å
å
. 
(1.10) 

Для контроля вычислений весь расчет повторяют с другим началом отсчета С, результаты должны совпадать с точностью до возможных ошибок округления.  

Задача 1.1. В табл. 1.1 в первом столбце записаны результаты 
n = 18 независимых равноточных измерений заряда электрона 
10
10
q
x
= ⋅
, полученных Милликеном. Вычислить оценки математического ожидания, дисперсии и среднего квадратического отклонения величины Х, провести контроль расчетов. 

Решение 
Выбираем С = 4,780 и, полагая h = 10–3, подсчитываем значения 

3
(
) /
(
4,780) /10
i
i
i
u
x
C
h
x
=
=
 и 
2
iu . Суммы чисел второго и 

третьего столбцов дают возможность рассчитать X  и S2: 

 
13 /18
0,72,
U =
=
 
3
4,780
0,72 10
4,7807;
X
=
+
⋅
=
 

 
(
)
2
6
2
4
10
6239
13 /18 /17
3,66 10
S
=
=
⋅
, 

откуда 
2
4
2
3,66 10
1,91 10 .
S
S
=
=
⋅
=
⋅
 
В последних двух столбцах приведены расчеты при другом начале 
отсчета С1 = 4,790, т.е. при замене 
3
(
4,790) /10
i
i
V
X
=
. Эти расче
ты дают те же значения X  и S: 

 
167 /18
9,2,
V =
= 
3
4,790
9,28 10
4,7809;
X
=
⋅
=
 

 
(
)
2
6
2
4
10
7779
167 /18 /17
3,66 10
S
=
=
⋅
. 

Таблица 1.1 

Исходные данные и результаты расчета к задаче 1.1 

Исходные 
Расчет 
Контроль 

данные X 
U 
U2 
V 
V2 

4,761 
–19 
361 
–29 
841 

4,792 
12 
144 
2 
4 

4,758 
–22 
484 
–32 
1024 

4,764 
–16 
256 
–26 
676 

4,810 
30 
900 
20 
400 

4,799 
19 
361 
9 
81 

4,797 
17 
289 
7 
49 

4,790 
10 
100 
0 
0 

4,747 
–33 
1089 
–43 
1849 

4,769 
–11 
121 
–21 
441 

4,806 
26 
676 
16 
256 

4,779 
–1 
1 
–11 
121 

4,785 
5 
25 
–5 
25 

4,790 
10 
100 
0 
0 

4,777 
–3 
9 
–13 
169 

4,749 
–31 
961 
–41 
1686 

4,781 
1 
1 
–9 
81 

4,799 
19 
361 
9 
81 

Σ 
13 
6239 
–167 
7779 

При большом числе исходных данных их предварительно группируют, т.е. весь диапазон значений X разбивают на l равных интервалов, подсчитывают число исходных данных, попавших в каждый j-й 
интервал, и относят это число (частоту mj) к середине интервала Xj 
(j = 1, 2, ..., l). Затем середины этих интервалов кодируют по формуле 
(1.8), выбирая за новое начало отсчета С середину одного из интервалов, а за масштабный коэффициент h – длину интервала. При таком 
кодировании все значения Uj будут целыми числами, которые для соседних интервалов отличаются на единицу. Расчет по сгруппированным данным дает лишь приближенные значения оценки математического ожидания X
C
hU
»
+
 и оценки дисперсии 
2
2
2
u
S
h S
»
, где 

 

1

1
;

l

j
j
j
U
U m
n
=
= å
 
(1.11) 

 

2
2
2
2

1
1
1
1
(
)
(
)
1

l
l

u
j
j
j
j
j
j
S
U
U
m
U m
nU
n
n
=
=

æ
ö÷
ç
÷
ç
=
=
÷
ç
÷
ç
÷
è
ø
å
å
.  
(1.12) 

Оценка дисперсия S2, вычисленная по сгруппированным данным, 
оказывается меньше оценки дисперсии, найденной по несгруппированным результатам эксперимента на величину, приблизительно 
равную h2/12. Это следует учитывать при округлении значения S, сохраняя лишь один сомнительный знак; значение среднего X  округляют при этом до единиц того разряда, который сохранен в значении 
S. Подобными соображениями можно руководствоваться и в тех случаях, когда результаты измерений округлены с учетом цены деления 
шкалы измерительного прибора (при этом обычными методами через 
цену деления шкалы оценивают погрешность вычисления S2). 

Задача 1.2. Проведено 52 эксперимента, их результаты оказались 
в диапазоне 22,75–26,75. Этот диапазон разбит на 8 интервалов длины h = 0,5, и сгруппированные данные эксперимента приведены в 
первых столбцах табл. 1.2. Вычислить оценки математического ожидания, дисперсии и среднего квадратического отклонения, провести 
контроль расчетов. 
Решение 
Для расчета выбрано начало отсчета С = 24,5, а для контроля 
С1 = 25,0. Кодировка имеет соответственно вид U = (X – 24,5)/0,5; 
V = (X – 25,0)/0,5. 

Таблица 1.2 

Исходные данные и результаты расчета к задаче 1.2 

Интервал 
Середина X 
m 
Расчет 
Контроль 

 
 
 
U 
mU 
mU2 
V 
mV 
mV2 

22,75–23,25 
23,0 
2 
–3 
–6 
18 
–4 
–8 
32 

23,25–23,75 
23,5 
4 
–2 
–8 
16 
–3 
–12 
36 

23,75–24,25 
24,0 
8 
–1 
–8 
8 
–2 
–16 
32 

24,25–24,75 
24,5 
11 
0 
0 
0 
–1 
–11 
11 

24,75–25,25 
25,0 
16 
1 
16 
16 
0 
0 
0 

25,25–25,75 
25,5 
7 
2 
14 
28 
1 
7 
7 

25,75–26,25 
26,0 
3 
3 
9 
27 
2 
6 
12 

26,25–26,75 
26,5 
1 
4 
4 
16 
3 
3 
9 

Σ 
– 
52 
– 
21 
129 
– 
–31 
139 

Суммирование проводится только в столбцах, где учитывается частота m, т.е. в столбцах m, mU, mU2 (mV, mV2). По данным таблицы расчета получаем: 
21/ 52
0,404
U =
=
, 
24,5
0,5 0,404
24,702
X =
+
⋅
=
; 
(
)
(
)
2
2
129
21
/ 52 / 51
2,363
U
S
=
=
, 
0,5 2,363
0,769
S =
=
. Контроль 

дает те же значения X  и 
2
V
S , а значит, и 
V
S :  

 
V = –31/52 = – 0,596, X  = 25,0 + 0,5(–0,596) = 24,702; 
 
2
V
S  = (139 – (–31)2/52)/51 = 2,363, 
V
S  = 0,769. 

Погрешность вычисления 
2
S  приблизительно равна (–0,52)/12, что 

составляет примерно 3,5 %, погрешность вычисления 
2
S
S
=
 примерно 2 %, т.е. 0,015. Поэтому значения S и x  округляем до двух десятичных знаков, что дает X  = 24,70, S = 0,77. 

1.2. Оценка математического ожидания 
по неравноточным измерениям 

Часто встречающимся на практике случаем неповторной выборки 
является выборка, в которой случайные величины 
1
2
,
,...,
n
X
X
X  взаимно независимы, имеют одинаковые математические ожидания, но 
различные дисперсии. Такие измерения называют неравноточными. 
Как правило, дисперсии каждой величины 
i
X  неизвестны, но известны отношения дисперсий. Числа, обратно пропорциональные 
дисперсиям, называют весами измерений и обозначают 
iw : 

Доступ онлайн
2 000 ₽
В корзину