Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Решение задач теории вероятностей и математической статистики в среде Scilab

Покупка
Новинка
Доступ онлайн
500 ₽
В корзину
Рассматриваются возможности системы компьютерной математики Scilab для проведения статистического анализа данных на ПК, вопросы генерирования случайных величин с заданным законом распределения. Описывается технология работы со статистическим блоком среды Scilab. Содержатся краткие сведения из теории вероятностей и математической статистики, облегчающие восприятие излагаемого материала. Для оценки уровня усвоения студентами пройденного материала предложены варианты заданий для самостоятельной работы. Предназначено для студентов, обучающихся по направлениям подготовки 09.03.02 «Информационные системы и технологии», 22.03.01 «Материаловедение и технологии материалов», 18.03.01 «Химическая технология», 28.03.02 «Наноинженерия». Подготовлено на кафедре информатики и прикладной математики.
Титов, А. Н. Решение задач теории вероятностей и математической статистики в среде Scilab : учебно-методическое пособие / А. Н. Титов, Р. Ф. Тазиева. - 2-е изд., стер. - Казань : КНИТУ, 2019. - 120 с. - ISBN 978-5-7882-2605-7. - Текст : электронный. - URL: https://znanium.com/catalog/product/1897897 (дата обращения: 27.11.2022). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Министерство науки и высшего образования Российской Федерации

Федеральное государственное бюджетное

образовательное учреждение высшего образования

«Казанский национальный исследовательский

технологический университет»

А. Н. Титов, Р. Ф. Тазиева

РЕШЕНИЕ ЗАДАЧ ТЕОРИИ 

ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКОЙ 

СТАТИСТИКИ В СРЕДЕ SCILAB

2-е изд., стереотипное

Учебно-методическое пособие

Рекомендовано УМО РАЕ по классическому университетскому 
и техническому образованию 
в качестве учебно-методического пособия для 
студентов высших учебных заведений, обучающихся 
по направлениям подготовки 09.03.02 –
«Информационные системы и технологии», 
22.03.01 – «Материаловедение и технологии материалов», 
18.03.01 – Химическая технология», 
28.03.02 – «Наноинженерия».

Казань

Издательство КНИТУ

2019
УДК 519.21:004(07)
ББК 22.171:32.97я7

Т45

Печатается по решению редакционно-издательского совета 

Казанского национального исследовательского технологического университета

Рецензенты:

д-р техн. наук, проф. М. Х. Хайруллин

канд. экон. наук О. С. Семичева

Т45

Титов А. Н. 
Решение задач теории вероятностей и математической статистики 
в среде Scilab : учебно-методическое пособие / 
А. Н. Титов, Р. Ф. Тазиева; Минобрнауки России, Казан. 
нац. исслед. технол. ун-т. – 2-е изд., стереотип. – Казань : 
Изд-во КНИТУ, 2019. – 120 с.

ISBN 978-5-7882-2605-7

Рассматриваются возможности системы компьютерной математики 
Scilab для проведения статистического анализа данных на ПК, вопросы 
генерирования случайных величин с заданным законом распределения. 
Описывается технология работы со статистическим блоком 
среды Scilab. Содержатся краткие сведения из теории вероятностей и 
математической статистики, облегчающие восприятие излагаемого материала. 
Для оценки уровня усвоения студентами пройденного материала 
предложены варианты заданий для самостоятельной работы.

Предназначено для студентов, обучающихся по направлениям подготовки 
09.03.02 «Информационные системы и технологии», 22.03.01 
«Материаловедение и технологии материалов», 18.03.01 «Химическая 
технология», 28.03.02 «Наноинженерия».

Подготовлено на кафедре информатики и прикладной математики.

ISBN 978-5-7882-2605-7
© Титов А. Н., Тазиева Р. Ф., 2019
© Казанский национальный исследовательский 

технологический университет, 2019

УДК 519.21:004(07)
ББК 22.171:32.97я7
ОГЛАВЛЕНИЕ

Введение......................................................................................................5

1. ЗАДАЧИ ТЕОРИИ ВЕРОЯТНОСТЕЙ................................................7

1.1. Дискретные случайные величины и их характеристики..............7

1.2. Статистические функции Scilab для работы с дискретными 
случайными величинами.........................................................................9

1.3. Непрерывные случайные величины и их характеристики..........13

1.3.1. Нормальный закон распределения........................................15

1.3.2. Распределение Шарлье ..........................................................20

1.3.3. Логарифмически нормальное распределение......................23

1.3.4. Распределение Фишера–Снедекора......................................27

1.3.5. Гамма-распределение.............................................................29

1.3.6. Бета-распределение................................................................31

1.3.7. Распределение хи-квадрат .....................................................33

1.3.8. Распределение Стьюдента .....................................................35

1.3.9.  Распределение Вейбулла ......................................................37

1.3.10. Показательное (экспоненциальное) распределение..........40

1.3.11. Распределение Коши............................................................42

1.3.12. Распределение Накагами .....................................................44

1.4. Генерирование случайных чисел в Scilab.....................................46

1.5. Случайные векторы ........................................................................63

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ.............................66

2. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА............................................69

2.1. Расчет выборочных характеристик статистического 
распределения ........................................................................................69

2.1.1. Точечные оценки ............................................................................69

2.1.1.1. Средние величины в статистике ........................................70

2.1.1.2. Характеристики рассеяния .................................................74
2.1.1.3. Другие характеристики формы и рассеяния.....................80

2.1.1.4. Построение гистограммы и полигона частот в Scilab......83

2.1.1.5. Работа с таблицами, содержащими нечисловые данные.....
(nan – not-a-number)……………………………..............................85

2.1.2. Интервальные (доверительные) оценки параметров 
распределения...........................................................................................88

2.1.2.1. Построение доверительного интервала для 
математического ожидания и дисперсии .......................................89

2.1.2.2.  F – тест. Случай нескольких выборок ..............................94

2.2. Корреляция и регрессия .................................................................97

3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ .......................101

3.1. Понятие множественной корреляции .........................................101

3.2. Измерение тесноты множественной линейной корреляционной 
связи ......................................................................................................109

3.3. Проверка адекватности модели множественной линейной 
корреляции ...........................................................................................110

ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ...........................115

ЛИТЕРАТУРА ........................................................................................118

Предметный указатель ...........................................................................119
ВВЕДЕНИЕ

Одним из важнейших аналитических инструментариев в сфере 

поддержки процессов принятия решений являются статистические методы. 
Статистикой пользуются все – от политиков, желающих предсказать 
исход выборов, до предпринимателей, стремящихся оптимизировать 
прибыль при тех или иных вложениях капитала. Применение экономико-
математических методов и использование вычислительной 
техники при анализе социально-экономических явлений значительно 
продвинуло развитие статистической науки.

Мощными возможностями статистической обработки данных 

обладают специализированные программные продукты, такие как Stat-
graphics, Statistica, SPSS Statistics и др. Стандартные статистические методы 
обработки данных включены в состав электронных таблиц, таких
как Lotus 1-2-3, Excel, в математические пакеты общего назначения, такие 
как Mathcad, Matlab, Scilab. Свободно распространяемая система 
компьютерной математики Scilab предоставляет пользователю большое 
количество (несколько сотен) функций для анализа и обработки 
данных, в частности функции для решения задач интерполяции и аппроксимации,  
математической статистики и анализа данных (статистические 
функции, статистическая регрессия, цифровая фильтрация, 
быстрое преобразование Фурье и другие), возможности обработки данных (
набор специальных функций, включая построение графиков, оптимизацию, 
решение уравнений, численное интегрирование и другие).
Scilab поддерживает язык программирования высокого уровня для организации 
технических вычислений. Последний факт выгодно отличает 
Scilab наряду с Mathcad и Matlab от упомянутых выше специализированных 
пакетов, так как решение статистических задач является, как 
правило, лишь частью общей задачи, стоящей перед исследователем.

Настоящее пособие призвано помочь тем пользователям (студентам, 
магистрам, аспирантам), которые используют или собираются использовать 
систему компьютерной математики Scilab для статистического 
анализа данных. При написании пособия авторы предполагают, 
что читатель уже имеет базовые знания по теории вероятностей и математической 
статистике, поэтому часть материала, с которой обычно 
начинается изложение основ теории вероятностей и математической 
статистики, опущена. Однако там, где это необходимо, приводятся
нужные формулы с пояснениями. Предполагается также, что читатель 
знаком с основами работы в среде Scilab.
Для облегчения понимания материал излагается в виде демонстрационных 
примеров и задач, поскольку «при изучении наук примеры 
полезней правил» (Ньютон). При работе с данным пособием не 
обязательно читать все подряд, можно просто попробовать найти пример, 
похожий на тот, решение которого интересует читателя. 

Пособие включает в себя три раздела. В первом разделе рассмотрены 
статистические функции для работы с дискретными (4 закона)  и 
непрерывными (12 законов) случайными величинами (далее СВ), вопросы 
генерирования СВ с заданным законом распределения (11 законов), 
вычисления ковариации и коэффициента корреляции. Во втором
разделе рассмотрены вопросы оценки параметров распределения (точечные 
и интервальные оценки для математического ожидания и дисперсии), 
построения гистограмм, приведены примеры решения задач на 
F-тест, построения матриц ковариации, уравнения линейной регрессии. 
Рассмотрены вопросы работы с выборками, содержащими нечисловые 
данные (в Scilab это данные, принимающие значения NaN – not-a-num-
ber). В третьей части на примерах рассмотрены решения задач построения 
уравнения множественной линейной регрессии, построения доверительных 
интервалов для найденных коэффициентов регрессии. Показано, 
как можно проверить значимость построенной модели. С целью 
расширения возможностей экономического анализа показано, как в выбранной 
программной среде рассчитываются множественный коэффициент 
корреляции, коэффициенты эластичности, парной корреляции, 
вариации, бета-коэффициенты (коэффициенты риска), коэффициенты 
детерминации и Q-коэффициенты. Теоретические аспекты экономической 
интерпретации результатов, полученных в разделе три, выходят за 
пределы интересов данного пособия, главной целью которого являются 
вопросы обработки экспериментальных данных при решении статистических 
задач как с использованием статистических функций Scilab, так 
и без них, если таковых функций в системе нет.

Все расчеты, приведенные в учебном пособии, выполнены в 

среде Scilab (версия 6.0.1).
1. ЗАДАЧИ ТЕОРИИ ВЕРОЯТНОСТЕЙ

1.1. Дискретные случайные величины и их характеристики

Случайной величиной X называется величина, которая в результате 
опыта (или испытания) принимает какое-либо значение, причем заранее 
неизвестно, какое именно.

Пример 1.1. Подбрасывается игральная кость. Число, появляющееся 
на верхней грани, ꟷ случайная величина. 

Случайные величины бывают дискретными и непрерывными.
Дискретная случайная величина – это величина, принимающая 

конечное (или счетное) множество значений. В примере 1.1 случайная 
величина является дискретной, принимающей шесть значений {1, 2, 3, 
4, 5, 6}.

Дискретная случайная величина задается законом или рядом распределения.


Закон распределения дискретной СВ Х – это таблица, в первой 

строке которой перечислены все значения, которые может принять случайная 
величина X, а в нижней  – вероятности того, что случайная величина 
X примет данное значение.

X
х1
х2
…
хn

P
p1
p2
…
pn

1
(
),
1, ,
1.

n

i
i
i
i
p
P X
x
i
n
p

=
=
=
=
=


Если по оси абсцисс отложить значения x1, x2, …, xn, а по оси ординат 
ꟷ соответствующие вероятности p1, p2,…, pn, и соединить соседние 
точки отрезками, то получим многоугольник распределения случайной 
величины X.

Характеристики случайной величины Х.
1. Функция распределения F(x).
Функция распределения F(x) действительной переменной x определяется 
формулой (1.1):

F(x)=P(X<x).
(1.1)

Это вероятность того, что случайная величина X примет значение

меньшее, чем х. Функция распределения может принимать значения от 
0 до 1.

2. Математическое ожидание M(X). Это число, подсчитываемое 

по формуле
1
(
)
.
(1.2)

n

k
k
k
M X
x p

=
=

3. Мода случайной величины X.
Определяется как такое возможное значение случайной величины 
X, вероятность которого максимальна. Так, xm – мода случайной 
величины X, если 

max
.
(1.3)
m
k
k
P(X
x )
{P(X
x )}
=
=
=

4. Дисперсия D(X). Дисперсией (рассеянием) случайной величины 
называется математическое ожидание квадрата ее отклонения от 
математического ожидания.

Это неотрицательное число, подсчитываемое по формуле

2
2

1
(
)
(
(
))
(
(
))
.
(1.4)

n

k
k
k
D X
M X
M X
x
M X
p

=
=
−
=
−


Можно доказать, что

2
2
2
2

1
(
)
(
)
(
(
))
(
(
)) .
(1.5)

n

k
k
k
D X
M X
M X
x p
M X

=
=
−
=
−


5. Среднеквадратическое отклонение  (
):
Х


(
)
(
).
(1.6)
X
D X

=

σ(Х) имеет размерность случайной величины. D(X) и σ(X) характеризуют 
степень рассеяния случайной величины относительно ее математического 
ожидания.

6. Начальный момент m-го порядка αm(X), m=0,1, 2, …
Это число

1
(
)
(
).
(1.7)

n
m
m
m
k
k
k
X
x p
M X


=
=
=


7. Центральный момент m-го порядка μm(X):

1
(
)
(
(
))
(
(
))
.
(1.8)

n
m
m
m
k
k
k
X
M X
M X
x
M X
p


=
=
−
=
−


8. Коэффициент асимметрии, или «скошенности», распределения 

(
):
As X

3
3
(
)
(
)
.
(1.9)
(
)
X
As X
X


=

9. Коэффициент эксцесса распределения Ex(X):

4
4
(
)
(
)
3.
(1.10)
(
)
X
Ex X
X


=
−
1.2. Статистические функции Scilab для работы с дискретными 

случайными величинами

Для работы с дискретными СВ в Scilab предназначены функции 

binomial, cdfbin, cdfnbn, cdfpoi. 

Пусть проводится  n последовательных испытаний, в каждом из 

которых может произойти некоторое случайное событие  А. Испытания 
независимы друг от друга. Пусть задана вероятность наступления события  
А в  одном испытании (опыте) p(A)=p и она не меняется от 
опыта к опыту. 

Пусть  X – случайная величина, равная числу наступлений события  
А  в  n опытах. Очевидно, 
n
X
,0
=
.

Вероятность того, что в  n опытах событие  А наступит ровно  m

раз, подсчитывается по формуле Бернулли:

!
(
)
(1
)
(1
)
.
!(
)!

m
m
n m
m
n m
n
n
n
P X
m
C p
p
p
p
m n
m

−
−
=
=
−
=
−
−
(1.11)

Здесь n!=1·2·3···n. Так, 5!=1·2·3·4·5=120. Принято считать, что 

0!=1.

Говорят, что случайная величина X имеет биномиальное распределение. 


Вероятность того, что в  n опытах событие  А наступит не более  

m раз, можно вычислить по формуле (1.12):

(
)
(0)
(1)
(2)
...
( ).
n
n
n
n
n
P X
m
P
P
P
P m

=
+
+
+
+
(1.12)

Каждое 
m
i
i
Pn
,
0
),
(
=
в (1.12)  вычисляют по формуле (1.11).

Можно доказать, что 
1
)
(
...
)
2
(
)1(
)
0
(
=
+
+
+
+
n
P
P
P
P
n
n
n
n
.

Пример 1.2. Проведено 4 независимых испытания, в каждом из 

которых может произойти некоторое событие А с вероятностью 0,2. 
Построить закон распределения СВХ – числа наступлений события А –
и вычислить вероятность того, что СВХ примет значение, не превосходящее 
двух. Построить многоугольник распределения СВХ .

Решение. Случайная величина Х может принять 5 разных значений – 
от 0 до 4. Для подсчета вероятностей воспользуемся функцией 
binomial.

-> x=0:4;p=binomial(0.2,4);[x;p]
ans =        0.          1.            2.           3.          4.    

0.4096   0.4096   0.1536   0.0256   0.0016

В этом примере первый элемент массива p (вторая строка) – это 

P4(0), последний – P4(4).
Для того чтобы определить вероятность того, что СВХ примет 

значение, не превосходящее двух P(X≤2), используем функцию cdfbin.  
Она может иметь следующий вид:

[P,Q]=cdfbin("PQ",S,Xn,Pr,Ompr)
[S]=cdfbin("S",Xn,Pr,Ompr,P,Q)
[Xn]=cdfbin("Xn",Pr,Ompr,P,Q,S)
[Pr,Ompr]=cdfbin("PrOmpr",P,Q,S,Xn)
Здесь Pr – вероятность наступления события А в одном опыте 

Ompr=1–Pr; Xn – число опытов, S – максимальное интересующее нас 
число наступлений события А (в нашем примере 2), P+Q=1. Тогда

--> p1=cdfbin("PQ",2,4,0.2,0.8)
p1 = 0.9728
Для построения многоугольника распределения добавляем одну 

строку: 

--> plot(x,p,'.r-')
Получаем требуемый график.

Математическое ожидание случайной величины Х, имеющей 

биномиальное распределение, 
(
)
M X
np
=
, где р – вероятность наступления 
события в одном опыте,  дисперсия
(
)
(1
)
D X
np
р
=
−
; 

α2=np[(n–1)p+1], α3=np[(n–1)(n–2)p2+3(n–1)p+1], μ3=npq(q–p), (q=1–p),
μ4=npq[1+3pq(n–2)]. Коэффициенты вариации, асимметрии и эксцесса 

равны соответственно

1 6
,
,
.
q
q
p
pq
V
As
Ex
np
npq
npq
−
−
=
=
=

Пусть в схеме Бернулли с вероятностью наступления события А

в одном опыте, равной р, заранее фиксируется число появлений события 
А, после которого испытания прекращаются (m). Пусть случайная 
величина Х – число непоявлений события А до момента наступления m-
го события А. Например, Х – число бракованных изделий до изготовления 
сотого (m=100) небракованного.  Случайное число Х неудачных испытаний 
до появления m-го успеха (наступления события А) подчиняется 
отрицательному биноминальному распределению. Распределение 
используется при планировании запуска  изделий в производство для 
получения требуемого количества годных изделий при известном проценте 
выхода годных, при планировании объема испытаний до получения 
заданного числа отказов [1].

Вероятность того, что случайная величина Х до наступления m

успеха примет значение k

,
1
(
1)!
(
)
(1
)
(1
)
!(
1)!

k
m
k
m
k
m p
k m
k
m
P
X
k
C
p
p
p
p
k m
+
−
+
−
=
=
−
=
−
−
, m≥1; k=0,1, 2, ... (1.13)

Математическое ожидание, дисперсия, коэффициенты вариации, 

асимметрии и эксцесса равны соответственно 

2
(1
)
(1
)
1
(
)
,
(
)
,
,
(1
)

m
p
m
p
M X
D X
V
p
p
p
p

−
−
=
=
=
−




2
1
2
6
(2
)
(1
)
,
3
.
(1
)
p
As
p m
p
Ex
m
m
p

−
=
−
−
= +
+
−

У этого распределения множество возможных значений случайной 
величины не ограничено сверху.

Для работы с отрицательным биномиальным распределением в 

Scilab используется функция cdfnbn. Синтаксис функции:

[P,Q]=cdfnbn("PQ",S,Xn,Pr,Ompr)
[S]=cdfnbn("S",Xn,Pr,Ompr,P,Q)
[Xn]=cdfnbn("Xn",Pr,Ompr,P,Q,S)
[Pr,Ompr]=cdfnbn("PrOmpr",P,Q,S,Xn)
В первой формуле P – вероятность того, что до получения Xn

успехов произойдет не более S неудач,  Pr – вероятность успеха в одном 
испытании (р),  Ompr=1–Pr. 
Пример 1.3. Вероятность получения дефектного изделия равна 

0.1. Какова вероятность того, что будут произведены 50 годных изделий 
до появления десятого дефектного изделия. Вычислить вероятность 
того, что до появления второго дефектного изделия будет произведено 
не более 5 годных изделий.

Решение. Успех здесь – появление бракованного изделия. Нужно 

определить вероятность того, что произойдет k «неуспехов» (произведено 
50 годных изделий k=50) до появления десятого «успеха» (m=10). 
Вероятность успеха равна 0.1.

В формуле (1.13) m=10; p=0.1; k=50. 

10
10
50
10
10
50
50 10 1
59
(
10)
0.1 0.9
0.1 0.9
0.03238.
P X
C
C
+
−
=
=
=
=

Для решения задачи в Scilab воспользуемся первой из приведенных 
формул. В ней успех – появление годного изделия,  Pr =0.9, Xn=50.
P=P(X≤10) –P(X≤9).

P=cdfnbn("PQ",10,50,0.9,0.1) –cdfnbn("PQ",9,50,0.9,0.1)
Ответ: P  = 0.0323803.
cdfnbn("PQ",10,50,0.9,0.1) – это вероятность того, что до появления 
50 годных изделий бракованных будет не более 10.

Вероятность того, что до появления второго дефектного изделия 

будет произведено не более 5 годных изделий, равна

0
2
0
1
2
1
2
2
2
1
2
3

3
2
3
4
2
4
5
2
5
4
5
6

(
5)
0.1 0.9
0.1 0.9
0.1 0.9

0.1 0.9
0.1 0.9
0.1 0.9
0.1496944.

P X
C
C
C

C
C
C


=
+
+
+

+
+
+
=

Во второй части задачи «успех» – появление бракованного изделия, 
и до появления второго успеха (Xn=2) должно произойти не более 
5 неудач (число годных изделий S=5). Вероятность «успеха» Pr= 0.1. 
Тогда  (
)
(
)
Р Х
5 = cdfnbn "PQ",5,2,0.1,0.9


--> cdfnbn("PQ",5,2,0.1,0.9)
ans  = 0.1496944 

Если в формуле (1.11) n велико (больше 30), а p(A) – мала, то 

пользоваться этой формулой становится неудобно. Доказано, что в этом 
случае вероятность того, что в n испытаниях событие A наступит ровно 
k раз, можно подсчитать по формуле Пуассона: 

!
)
(
k
e
k
P

k

n

 
=

−

,
(1.14)
  • document_id: 416385
  • product_id: 1897897
  • ins_time: 2022-07-05 20:35:05
  • upd_time: 2022-07-05 20:35:05
  • upp_upd_date: 2022-07-05
  • Full PDF: WARN Путь не доступен (не определен) /mnt/znanium_fullpdf/booksfull/done/1897/1897897.pdf
  • PDF pages: OK /mnt/resources/resources/1897/1897897/pdf Страниц(120), Путь /mnt/resources/resources/1897/1897897/pdf
  • XML pages: OK /mnt/resources/resources/1897/1897897/xml Страниц(120)
  • text *.idx: OK
  • Full text: OK /mnt/resources/resources/1897/1897897/txt/1897897.txt
  • Оглавления: OK Путь /mnt/resources/resources/1897/1897897/txt/1897897.toc.txt
Доступ онлайн
500 ₽
В корзину