Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Типовые задачи математической статистики

Покупка
Основная коллекция
Артикул: 631581.01.99
Доступ онлайн
24 ₽
В корзину
Неделько, С. В. Типовые задачи математической статистики/НеделькоС.В., НеделькоВ.М., МиренковаГ.Н. - Новосибирск : НГТУ, 2014. - 52 с.: ISBN 978-5-7782-2481-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/546259 (дата обращения: 27.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.

Министерство образования и науки Российской Федерации
НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ



С.В. НЕДЕЛЬКО, В.М. НЕДЕЛЬКО, Г.Н. МИРЕНКОВА





                ТИПОВЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ
                СТАТИСТИКИ




Утверждено Редакционно-издательским советом университета в качестве учебного пособия








НОВОСИБИРСК

2014

УДК 519.2(075.8)
      Н421
Рецензенты:
канд. физ.-мат. наук, доцент Э.Г Соснина канд. физ.-мат. наук, доцент АЛ. Ковалевский

Работа подготовлена кафедрой высшей математики для студентов II курса РЭФ


            Неделько С.В.


Н421 Типовые задачи математической статистики: учеб. пособие/ С.В. Неделько, В.М. Неделько, Г.Н. Миренкова. - Новосибирск: Изд-во НГТУ, 2014. - 52 с.
         ISBN978-5-7782-2481-0
          Пособие содержит изложение методов решения ряда базовых задач математической статистики, а также задания для самостоятельной работы.

Неделько Светлана Валерьевна Неделько Виктор Михайлович Миренкова Галина Николаевна

ТИПОВЫЕ ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Учебное пособие

Редактор ИЛ. Кескевич Выпускающий редактор ИП Брованова Корректор ИЕ. Семенова Дизайн обложки А.В. Ладыжская Компьютерная верстка С. Я. Ткачева
Налоговая льгота - Общероссийский классификатор продукции Издание соответствует коду 95 3000 ОК 005-93 (ОКИ)


Подписано в печать 30.06.2014. Формат 60 х 84 1/16. Бумага офсетная. Тираж 250 экз.
Уч.-изд. л. 3,02. Печ. л. 3,25. Изд. № 333/13. Заказ №      . Цена договорная


Отпечатано в типографии Новосибирского государственного технического университета 630073, г. Новосибирск, пр. К. Маркса, 20

УДК 519.2(075.8)

ISBN 978-5-7782-2481-0                         © Неделько С.В., Неделько В.М.,
                                                   Миренкова Г.Н., 2014
                                                © Новосибирский государственный технический университет, 2014

ОГЛАВЛЕНИЕ


1. Основные понятия из теории вероятностей и математической статистики .......................................................
2. Эмпирическая функция распределения. Гистограмма...........
3. Точечные оценки параметров распределения..................
4. Доверительные интервалы для моментов. Доверительная вероятность
5. Оценивание параметров. Метод моментов.....................
6. Метод максимального правдоподобия.........................
7. Критерии согласия.........................................
8. Критерий отношения правдоподобия..........................
9. Задания практических работ................................
Ответы.......................................................
Приложение 1.................................................
Приложение 2.................................................
Приложение 3.................................................
Приложение 4.................................................
Библиографический список.....................................

..4
..7
12
14
19
23
26
32
38
43
46
47
48
49
50

1. ОСНОВНЫЕ ПОНЯТИЯ ИЗ ТЕОРИИ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ


   В настоящем разделе вводятся основные используемые понятия из теории вероятностей и математической статистики. Приведенные определения включены как справочный материал, и их рассмотрение не заменяет изучения теоретического курса.
   Для чтения пособия желательно знакомство с теорией вероятностей и математической статистикой в рамках начальных курсов, например [1,2,4,5]. Допустимо, если при первом прочтении часть материала данного раздела останется непонятной. Это не препятствует изучению последующих разделов.
   Базовым понятием теории вероятностей является вероятностное пространство, которое включает множество элементарных исходов О, ст-алгебру Л событий и вероятностную меру Р.
   В качестве множества элементарных исходов может выступать любое конечное, счетное или континуальное множество Q.
   Алгебра событий есть некоторое множество, состоящее из подмножеств множества Q и удовлетворяющее определенным условиям, которые мы приводить не будем.

   Функция Р: Л ^ R называется вероятностной мерой, если: 1) VА еЛ, Р(А) > 0;
   2) Р(0) = 0, Р(Q) = 1;
   3) для попарно несовместных (непересекающихся)


ТО \ ТО



   Случайной величиной X - X(ю) называется измеримая функция X: Q ^ R. Измеримость здесь означает существование функции распределения F (х) - Р (X (ю) < х).


4

   Для пояснения содержательного смысла введенных понятий рассмотрим пример. Предположим, что исследуется концентрация яда в железах змей некоторого вида. Для этого ловится определенное количество змей и изучается их яд.
   В этом случае множество всех змей заданного вида можно отождествить с множеством Q, а конкретную пойманную змею - с элементарным исходом го. Факт поимки определенной змеи будет случайным событием. Событие - это подмножество исходов, поэтому рассматриваем подмножество, состоящее из одной змеи. Считаем, что для каждой змеи существует (определена) вероятность быть пойманной.
   Поскольку концентрация яда - это функция змеи, она также случайна. Для любого числа х можно определить вероятность того, что концентрация яда в железах случайной пойманной змеи не превзойдет х . Эта вероятность, по определению, есть значение функции распределения в точке х.
   Важным моментом является то, что Q - это множество не только реально существующих змей, но и всех змей, которые, по нашим представлениям, могли бы существовать. Такое соглашение нужно для того, чтобы иметь возможность оперировать с непрерывными случайными величинами. В противном случае, если рассматривать только существующих змей, то множество Q будет конечным, а все функции на этом множестве, в том числе случайные величины, - дискретными.
   При пользовании данным пособием читатель может иод случайной величиной понимать просто некоторую переменную X, для которой определена функция распределения. При этом иод функцией распределения достаточно понимать некоторую функцию F(х), такую что:
   1) F(-«) = 0;
   2) F(<ю) = 1;
   3) V а < b, Р (а < X < b) = F (b) - F (а) > 0;
   4) Vа, F(а - 0) = F(а).
   Величина Р(а < X < b) есть вероятность¹ попадания случайной величины X в интервал [а, b).
   Для системы случайных величин X₁,...,Xₙ определена совместная функция распределения F(х₁,..., хп) = Р(X₁ < х₁,...,Xₙ < хп).

    ¹ В рамках пособия свойство 3) можно использовать вместо определения вероятности.

5

    В математической статистике важную роль играют независимые случайные величины. Случайные величины называются независимыми, если их совместная функция распределения удовлетворяет условию F (xᵣ,..., хп ⁾ = Fₓ( Х₁) •... • Fₙ (хп ).
    Под выборкой понимается набор значений (х₁,...,хп), полученных как п независимых реализаций случайной величины X. Число п называется объемом выборки.
    Например, случайной величиной может быть измеряемое значение некоторой физической величины, тогда в качестве выборки будут выступать результаты п независимых измерений.
    В историческом значении термин «выборка» подразумевает выборку из так называемой генеральной совокупности. В примере со змеями генеральной совокупностью является множество всех змей, которых мы потенциально можем поймать, а выборку составляют фактически пойманные змеи.
    Заметим, что термин «генеральная совокупность» для нас не актуален, т. е. мы его не будем в дальнейшем использовать. Для простоты можно отождествлять генеральную совокупность с множеством элементарных исходов. В примере со змеями можно было бы генеральной совокупностью назвать множество реально существующих змей, но вряд ли такое понятие полезно для решения задач статистики. Дело в том, что фактически выборка производится, конечно, из множества реально существующих змей, но, поскольку мы не можем это множество описать и задать, приходится идеализированно считать, что выборка производится из множества «возможных» змей. Кроме того, сама совокупность реально существующих змей фактически есть случайная выборка из множества змей, которые потенциально могут появиться, поскольку рождение конкретной змеи - результат комбинации случайных факторов (полученный генетический материал, внешние условия).
    Итак, иод выборкой мы будем понимать просто набор случайных значений (реализаций) случайной величины и называть его выборкой из распределения.
    Под набором мы здесь понимаем упорядоченную последовательность. Это может показаться неожиданным, поскольку на практике порядок значений в выборке, как правило, не важен. Например, если мы перемешаем пойманных змей в клетке либо переставим результаты измерений свойств их яда, выводы не должны измениться. Тем не менее выборку мы должны записывать как последовательность значений, а не как множество.

6

   В математической статистике рассматриваются задачи, обратные ио отношению к задачам теории вероятностей. Если в задачах теории вероятностей по известным распределениям вычисляются вероятности тех или иных событий, то в математической статистике ио фактам наступления некоторых событий делаются выводы о распределениях.
   Исходно имеется выборка, полученная в результате п-кратного повторения эксперимента. Распределение F(х), которому подчиняются наблюдения, неизвестно. Требуется на основе информации, заложенной в выборке, насколько это возможно, восстановить закон распределения F(х). Достоверно восстановить распределение, имея лишь п реализаций случайной величины, невозможно, и любые выводы в этом случае будут носить вероятностный характер.
   Основные задачи математической статистики:
   1)    восстановление закона распределения непараметрическими методами;
   2)    оценивание параметров распределения (параметрические методы);
   3)    проверка состоятельности гипотезы о законе распределения.
   Для решения поставленных задач математическая статистика располагает рядом процедур и методов.
   Непараметрический подход включает такие способы восстановления распределения, как построение эмпирической функции распределения и гистограммы, а также множество методов (потенциальных функций и др.), не рассматриваемых в данном пособии.
   Представителями параметрических методов являются методы моментов и максимального правдоподобия для оценки параметров распределения. Некоторые другие методы читатель может найти в литературе. Также будет рассмотрено интервальное оценивание параметров распределения.



2. ЭМПИРИЧЕСКАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ. ГИСТОГРАММА


            Эмпирическая функция распределения


   На практике (истинная) функция распределения F (х) случайной величины X полностью или частично неизвестна. На основе информации, заложенной в выборке, можно построить приближение для неизвестной функции распределения.


7

   Эмпирической функцией распределения называется функция F(х) = т⁽Х⁾, где т(х) - количество значений из выборки (х—,...,хп), п
меньших х (т. е. число выборочных точек, расположенных на числовой оси левее заданного числа х).
   Эмпирическая функция распределения F (х) определяет частоту события, в то время как функция распределения F (х) = Р (X < х) определяет вероятность этого события.
   Значения эмпирической функции распределения F (х) изменяются от нуля до единицы, так же, как и у F(х).
   Построение эмпирической функции распределения - это простейший метод обработки наблюдаемых значений случайной величины.
   По теореме Бернулли при большом числе испытаний частота события X < х сходится ио вероятности к вероятности этого события. Следовательно, при любом заданном х функция F (х) сходится ио вероятности к функции распределения. Справедливо и более сильное утверждение, а именно теорема Гливенко-Кантелли.
   Для построения графика функции F (х) достаточно изобразить выборочные значения на числовой оси Ох и нарисовать ступенчатую функцию, возрастающую в каждой точке выборки на —. В наимень-п
шей выборочной точке и левее ее F (х) равна нулю, поскольку отсутствуют еще меньшие выборочные точки. В наибольшей выборочной точке эмпирическая функция распределения делает последний скачок и правее ее достигает единицы. Этот способ построения F(х) применим, когда все выборочные точки различны. Если же некоторое значение встречается в выборке г раз, то скачок в этой точке увеличивается также в г раз и составляет —.
п
   Эмпирическая функция распределения в точках разрыва непрерывна слева, что показывается стрелками на «ступенях».
   Функция F (х) является дискретной случайной функцией, так как делает скачки в случайных точках, определяемых выборочными значениями.

8

   В первом задании практической работы 1 нужно построить график эмпирической функции распределения для данных из табл. 4. Здесь и далее расчеты, графики и таблицы приводятся для выборки из варианта 0 табл. 4 и 5.
   На рис. 1 изображена эмпирическая функция распределения для выборки 1,8; 2; 3,3; 2,6; 1,3; -4; 0,5; 0,7; -0,7; 5,1; 5,7; 2 объема 12. Видно, например, что F (3) = 12. = 4, поскольку левее точки 3 расположено 9 выборочных точек из 12.


Л/с 1. Эмпирическая функция распределения для выборки из нормального распределения с параметрами т = 1,5 и ст = 2,5 и функция распределения

   Во всех точках выборки, кроме точки 2, F(х) возрастает на 1/12. В точку 2 попали две выборочные точки, поэтому скачок в ней вдвое больше, чем в точках, вошедших в выборку однократно, и равен 2/12 = 1/6.
   Для сравнения на рис. 1 показана функция распределения F(х) нормально распределенной случайной величины с математическим


9

ожиданием т = 1,5 и среднеквадратическим (стандартным) отклонением ст = 2,5 (параметры распределения указаны в последних колонках табл. 4). Выборка является реализацией этой случайной величины.



            Г истограмма



   Помимо приближения для функции распределения, ио выборке можно построить приближения для неизвестной плотности распределения. Простейшим из таких приближений является гистограмма, которую можно использовать как самостоятельно, так и на предварительных этапах обработки данных. Восстанавливать распределение с помощью гистограммы можно, если число наблюдений достаточно велико (на практике требуется не менее пятидесяти выборочных точек). Если число наблюдений невелико, то лучше использовать иные методы обработки данных, например построить эмпирическую функцию распределения.
   Для построения гистограммы в выборке (х₁,...,хп) объема п находятся наименьшее хₘᵢₙ и наибольшее хтях наблюдаемые значения.
   Затем диапазон [хₘᵢₙ, хтях ] наблюдаемых значений разбивается на несколько интервалов, которые могут быть как одинаковыми, так и разными ио длине. Далее будут рассматриваться только одинаковые интервалы [ sᵢ, sᵢ₊₁) длины Д = sᵢ₊₁ - sᵢ = хтях ^ хтш , где I есть число интервалов. В соответствии с обозначениями 5₁ = хₘᵢₙ, $г₊₁ = хтях .
   Для определенности считаем, что левые границы строго включены в интервалы, а правые - нестрого. Если значение из выборки совпадает с левой границей, то оно входит в интервал, если совпадает с правой границей, то относится к следующему интервалу. В последний интервал включается также самая правая граница.
   Границы интервалов можно выбирать и ио другим правилам, например, границы крайних интервалов могут не совпадать с минимальным и максимальным выборочными значениями.
   Для каждого интервала находится эмпирическая частота ио формуле рᵢ = — . Здесь щ есть количество значений выборки, попавшее в ⁱ п
i-vi интервал. Сумма эмпирических частот должна равняться единице.

10

   Также вычисляются относительные частоты Д-, т. е. значения эмпирических частот, отнесенные к длине интервала. Полученные данные заносятся в таблицу, называемую статистическим рядом, и графически представляются в виде гистограммы.
   Гистограммой называется ступенчатая фигура из прямоугольников с основаниями на Д и высотами, равными относительным частотам -Д-. Площадь гистограммы равна единице. Гистограмма является кусочно-постоянной аппроксимацией плотности вероятности.

Риг. 2. Гистограмма для выборки из нормального распределения с параметрами т = 29;п = 9 и плотность вероятности

   В первом задании практической работы 2 требуется построить гистограмму для данных из табл. 5. В отличие от табл. 4 выборка объема 100 здесь задается не конкретными значениями точек, а интервально. Весь диапазон значений от хₘᵢₙ = 10 до хтах = 50 предполагается уже разбитым на 1 = 10 интервалов длины 4. В шестой колонке табл. 5 перечислены через точку с запятой количества nₜ выборочных точек в каждом интервале.

11

Доступ онлайн
24 ₽
В корзину