Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Математическая статистика в задачах и упражнениях

Покупка
Основная коллекция
Артикул: 791444.01.99
Сформулированы типичные задачи математической статистики. Рассмотрена первичная статистическая обработка данных. Представлены оценки параметров распределений, элементы корреляционно-регрессионного анализа. Изложение теории сопровождается многочисленными примерами решения задач и упражнениями для самостоятельной работы. Для студентов IT-специальностей по направлениям «Бизнес-информатика», «Информатика и вычислительная техника», «Фундаментальная информатика и информационные технологии».
Зенков, А. В. Математическая статистика в задачах и упражнениях : учебное пособие / А. В. Зенков. - Москва ; Вологда : Инфра-Инженерия, 2022. - 108 с. - ISBN 978-5-9729-0866-0. - Текст : электронный. - URL: https://znanium.com/catalog/product/1902586 (дата обращения: 25.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.

A. В.Зенков













            МАТЕМАТИЧЕСКАЯ СТАТИСТИКА В ЗАДАЧАХ и упражнениях




Учебное пособие




















Москва Вологда «Инфра-Инженерия» 2022

УДК 519.22
ББК 22.172
     3-56




Рецензенты:
доктор педагогических наук, профессор кафедры информационных технологий и статистики Уральского государственного экономического университета Плещёв Владимир Васильевич;
кандидат физико-математических наук, доцент кафедры шахматного искусства и компьютерной математики Уральского государственного экономического университета Мельников Юрий Борисович



     Зенков, А. В.
3-56 Математическая статистика в задачах и упражнениях : учебное пособие / А. В. Зенков. - Москва ; Вологда : Инфра-Инженерия, 2022. -108 с. : ил., табл.
          ISBN 978-5-9729-0866-0

     Сформулированы типичные задачи математической статистики. Рассмотрена первичная статистическая обработка данных. Представлены оценки параметров распределений, элементы корреляционно-регрессионного анализа. Изложение теории сопровождается многочисленными примерами решения задач и упражнениями для самостоятельной работы.
     Для студентов IT-специальностей по направлениям «Бизнес-информатика», «Информатика и вычислительная техника», «Фундаментальная информатика и информационные технологии».

УДК 519.22
ББК 22.172

     На обложке приведен отрывок из опубликованного К. Ф. Гауссом в 1809 г. знаменитого сочинения «Theoria motus corporum coelestium» (в пер. с лат. «Теория движения небесных тел»). В этом отрывке содержится одна из первых публикаций идеи метода наименьших квадратов, который широко применяется в точных науках, а в настоящем учебном пособии рассматривается применительно к математической статистике.



ISBN 978-5-9729-0866-0

     © Зенков А. В., 2022
     © Издательство «Инфра-Инженерия», 2022
                            © Оформление. Издательство «Инфра-Инженерия», 2022

            ПРЕДИСЛОВИЕ



    Учебное пособие основано на односеместровом лекционном курсе Теории вероятностей и математической статистики, читавшемся автором в разные годы в Уральском федеральном университете студентам II курса бакалавриата по нематематическим направлениям, и посвящено рассмотрению второй части предмета - математической статистике. Пособие имеет практическую направленность, изложение теории сопровождается многочисленными примерами решения задач и упражнениями для самостоятельной работы.

    Литература по математической статистике неисчерпаема. В конце книги приведены ссылки на некоторые пособия, которые либо повлияли на содержание настоящей книги, либо рекомендуются для более глубокого знакомства с предметом.


3

            ГЛАВА 1


            ВЫБОРОЧНЫЙ МЕТОД



1.1. Предмет и задачи математической статистики


     Начиная изучение математической статистики, укажем, в чём её коренное отличие от тесно с ней связанной теории вероятностей. Несколько упрощая и заостряя это отличие, можно сказать, что теория вероятностей и математическая статистика преследуют противоположные цели. Если теория вероятностей, исходя из принимаемого известным закона распределения случайной величины, выводит её числовые характеристики, то математическая статистика на основе эмпирических, экспериментально измеренных числовых характеристик случайной величины пытается установить, по какому закону она распределена.
     На практике, как правило, вероятности наступления событий, законы распределения случайных величин и их параметры неизвестны. Для их определения (оценивания) необходимо провести эксперимент (испытание).
     Математическая статистика разрабатывает методы математической обработки результатов испытания с целью получения сведений о вероятностях наступления отдельных событий, о законах распределения случайных величин и параметров этих законов.
     Сформулируем типичные задачи математической статистики.
     1.     Оценка неизвестной функции распределения.. Пусть в результате измерений случайной величины X получены ее значения x1, x₂, ..., xn. Оценить неизвестную функцию или плотность распределения этой случайной величины.
     2.     Оценка параметров распределения. Пусть случайная величина X имеет функцию распределения F ( xj, зависящую от некоторых параметров. На основе экспериментальных данных оценить значения этих параметров.
     3.     Статистическая проверка гипотез. Пример гипотезы: предполагается, что функция распределения случайной величины X есть FX (x j; установить, согласуются ли полученные значения этой случайной величины с предположением о том, что она имеет такую функцию распределения.
     При обработке результатов эксперимента статистическими методами такие понятия теории вероятностей, как вероятность наступления случайного события, закон распределения случайной величины и его параметры, выступают в качестве математических моделей реальных закономерностей. Таким обра

4

зом, с помощью теории вероятностей можно создавать математические модели для описания реальных закономерностей случайных массовых явлений.
     Статистические методы описания реальных явлений базируются на экспериментальных статистических данных. Таковыми, например, могут быть: величины отклонения размеров деталей от номинального; замеры прочности образцов некоторого сорта стали; число вызовов на телефонной станции в течение определённого времени; данные о производительности труда рабочих предприятия за некоторый период и т. д. Таким образом, речь идёт о статистических данных случайных массовых явлений, поэтому предметом математической статистики являются случайные массовые явления, а её основной задачей - количественный и качественный анализы этих явлений.
     Математическая статистика занимается разработкой методов:
     1) планирования и организации статистических наблюдений;
     2) сбора статистических данных;
     3)     группировки и сокращения числа статистических данных с целью сведения их к небольшому числу параметров, которые в сжатом виде характеризуют всю исследуемую совокупность;
     4) анализа статистических данных;
     5)     принятия решений, рекомендаций и выводов на основе анализа статистических данных;
     6) прогнозирования случайных явлений.
     Одним из основных методов статистического наблюдения является выборочный метод, состоящий в том, что на основании характеристик и свойств некоторой совокупности значений Х1, x₂, ..., xn случайной величины X делаются заключения о числовых характеристиках и законе распределения самой случайной величины X. Рассмотрим примеры.
     1.     На консервном заводе для проверки качества консервов каждую отобранную банку приходится вскрывать, тем самым уничтожая продукт. Как проверить качество всей продукции, если сплошное обследование ее невозможно?
     2.     При проверке качества произведенных электроламп последние должны находиться под напряжением длительное время, что невозможно в условиях их массового производства. Как установить качество всей партии электроламп?
     В обоих примерах контролю на качество выпускаемой продукции подвергается только некоторая ее часть. Практика показывает, что выводы, сделанные на основании анализа выбранной части продукции, бывают достаточно надежными, чтобы распространить их на всю продукцию.

5

1.2. Генеральная и выборочная совокупность


    Генеральная, совокупность - это множество всех объектов (единиц), относительно которых предполагается делать выводы при изучении конкретной задачи.
    Генеральная совокупность может быть конечной или бесконечной. Число N элементов конечной генеральной совокупности называется её объёмом. В дальнейшем рассматриваются только конечные генеральные совокупности.
    Множество объектов, отобранных для изучения из генеральной совокупности, называется выборочной совокупностью или выборкой. Число n элементов выборки называется объёмом выборки.
    Для того чтобы по выборке можно было достаточно уверенно судить о генеральной совокупности, выборка должна быть представительной (репрезентативной ). Репрезентативность выборки обеспечивается случайностью, независимостью отбора и одинаковой возможностью (вероятностью) для каждого объекта попасть в выборку.
    Существует несколько способов отбора элементов из генеральной совокупности, обеспечивающих репрезентативность выборки. Вот некоторые из них.
        1.     Все элементы генеральной совокупности нумеруют, эти номера записывают на карточки, карточки тщательно перемешивают и наудачу выбирают по одной карточке до тех пор, пока не образуется необходимая выборка занумерованных элементов. При этом отбор элементов может осуществляться двумя вариантами.
        Первый вариант. Каждая вынутая после тщательного перемешивания карточка возвращается обратно в пачку. После неоднократного повторения такой процедуры получится выборка с возвратом (повторная выборка).
        Второй вариант. Вынутые карточки не возвращаются обратно в пачку.
   Тогда получается выборка без возврата (бесповторная выборка).
        2.     При большом объёме генеральной совокупности прибегают к помощи таблицы случайных чисел. И в этом случае можно образовать как повторные, так и бесповторные выборки.
    Можно убедиться, что для повторной и бесповторной выборки вероятность того, что элемент попадёт в выборку, не меняется при переходе от одного испытания к другому.

6

    Рассмотрим пример. В урне а белых и b черных шаров, отличающихся только цветом. Из урны случайным образом вынуты два шара. Найти вероятность того, что оба шара белые. Пусть событие A1 - первый шар белый,

A2 - второй шар белый. Для выборки с возвратом P ( A1 ) — P ( A2 ) — -a-.
a + b
a...  a..                          a a a
     Рассмотрим выборку без возврата. В этом случае P (A1) —------. Найдем
a + b
безусловную вероятность события A2. Наступлению события A2 могут предшествовать события: первый шар белый (гипотеза H1) или первый шар черный (гипотеза H2). По формуле полной вероятности:

P (A2 ) — P (H1) P (A2 / H1) + P (H 2) P (A2 / H 2 ) — a a -1 b a a —---------------I-----------—-----.
a + ba + b -1 a + ba + b -1 a + b

     Здесь важным является условие независимости испытаний, так как для вы-
_         _                        a- . . . a a -1
борки без возвращения              P ( A / A. ) —-----, следовательно,
                                    v 2    ¹⁷ a + b -1
P(A2 / Aᵢ)^ P(A2 ). В дальнейшем будем считать, что выражение «выборка с возвратом» означает независимость испытаний и проведение их в одинаковых условиях.


1.3. Первичная статистическая обработка данных


1.3.1. Статистический ряд


     Первичной обработкой полученных результатов наблюдений {X1, X2, ..., xn j случайной величины X является их расположение в порядке неубывания, т. е. ранжирование полученных результатов. Полученный ряд значений называется вариационным рядом. Разность между наибольшим и наименьшим значениями называется размахом вариационного ряда и обозначается и . Одинаковые значения X. случайной величины X называются вариантой . Варианты можно объединить в группы, в результате чего образуется последовательность пар (X., т.), где т. - число, называемое частотой варианты X.. В результате получится сгруппированный ряд, который называется


7

дискретным статистическим рядом. Такой ряд, как правило, записывается в виде

X  Х1 x 2  X.  X
            1  n
т. т1 т 2  т.  т
i           i  n

    В дискретном статистическом ряду можно указывать и относительные т. частоты ----.

П

     Пример 1.1. На телефонной станции проводились наблюдения над числом X неправильных соединений в минуту. Наблюдения в течение некоторого часа дали следующие результаты: 3, 1, 3, 1, 4, 2, 2, 4, 0, 3, 0,             2, 2, 0, 2, 1, 4, 3, 3, 1, 4,
2, 2, 1, 1, 2, 1, 0, 3, 4, 1, 3, 2, 6, 2, 0, 0, 1, 3, 3, 1, 2, 4, 2, 0, 2, 3, 1, 2, 5, 1, 1, 0, 1, 1,
2, 2, 1, 1, 5. Составить вариационный ряд и дискретный статистический ряд.
    Решение. Вариационный ряд имеет вид: 0, 0, 0, 0, 0,                 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3,
3,  3, 4, 4, 4, 4, 4, 4, 5, 5, 6. Размах этого ряда равен и = 6. Из полученного вариационного ряда видно, что все 60 значений случайной величины можно разбить на семь групп, в пределах каждой из которых все значения случайной величины X одинаковы. В данном примере различных вариантов семь: 0, 1, 2, 3, 4, 5, 6. Для каждой i-й группы подсчитаем частоту т. одинаковых значений или/и их

. ..   .     . ... mi ....               .        .         . ..... . .
относительную частоту — и запишем данные в виде таблицы, в которой пока-
                       n
зан дискретный статистический ряд:

X  0  1  2  3  4  5  6 
т. 8  17 16 10 6  2  1 
i                      
т.                     
i  2  17 4  1  1  1  1 
n  15 60 15 6  10 30 60

                        т
    Относительные частоты — иногда называют статистическими вероят-
                        n

ностями р.


8

     Если случайная величина X имеет большое число значений или является непрерывной, то используется интервальный статистический ряд. Этот ряд составляется следующим образом:
     1)      множество полученных значений случайной величины X разбивается на частичные интервалы равной длины h:
[X₀, x), [xq, x2), ..., [xn_1, xn];

     число k частичных интервалов можно рассчитать по формуле Стерджесса: k — 1 + 3,322lgn,


где n - число всех значений случайной величины X, тогда h — —, где ® — xₘₐₓ _ xₘᵢₙ - размах вариационного ряда;
    2)      подсчитываются частоты или относительные частоты числа значений случайной величины X, попавших в каждый i-й частичный интервал (число частичных интервалов, как правило, должно быть от 5 до 15).


     Пример 1.2. При измерении диаметра 50 деталей, изготовленных на одном и том же станке из одного и того же материала, получены результаты (мм):

6,75 6,74 6,79 6,76 6,76 6,74 6,74 6,76 6,77 6,73
6,78 6,77 6,75 6,74 6,77 6,83 6,72 6,77 6,73 6,74
6,72 6,77 6,75 6,73 6,70 6,68 6,74 6,74 6,77 6,74
6,77 6,74 6,78 6,76 6,77 6,80 6,76 6,76 6,71 6,78
6,68 6,75 6,76 6,74 6,81 6,71 6,73 6,75 6,74 6,75

     Составить интервальный статистический ряд.
     Решение. Жирным шрифтом в таблице выделены максимальный и минимальный варианты. Определим длину h частичных интервалов по формуле:

h —

6,83 _ 6,68
1 + 3,322lg50

~ 0,02 мм.

     Теперь можно составить интервальный статистический ряд в виде табл. 1:


9

Таблица 1

 №    Диаметр   т-  т, 
п/п   детали        n  
 1  6,68 - 6,70 2  0,04
 2  6,70 - 6,72 3  0,06
 3  6,72 - 6,74 6  0,12
 4  6,74 - 6,76 17 0,34
 5  6,76 - 6,78 15 0,30
 6  6,78 - 6,80 4  0,08
 7  6,80 - 6,82 2  0,04
 8  6,82 - 6,84 1  0,02

     В таблице указаны как частоты mi, так и относительные частоты



т. __i
n

1.3.2. Графическое изображение статистических рядов


     Графическими изображениями статистических рядов являются полигоны и гистограммы.
     Полигон применяется для дискретных и интервальных статистических рядов. Для построения полигона дискретного статистического ряда используются
  .       ... . . (.X                С. mi V ________________ . . .
точки с координатами I x., т. I или I X., — . Для построения полигона ин-
                        \ i if       I i   -tri

    k ⁿ 7


тервального статистического ряда используются точки с координатами

X. + X.   т. 7
i-1  i  i_
2    , hj

или

т. 7 , -i-

    nh j


В каждом случае построенные точки

соединяются последовательно отрезками, в результате чего получается ломаная. Такая ломаная называется полигоном соответственно частот или относительных частот. Полигон относительных частот для дискретного статистического ряда называют многоугольником распределения, относительных частот. Сумма ординат многоугольника распределения относительных частот равна 1.

10