Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Информационные технологии статистической обработки данных

Покупка
Основная коллекция
Артикул: 708936.01.99
Доступ онлайн
151 ₽
В корзину
Исследуются информационные технологии построения и анализа статистических моделей параметров радиотехнических и телекоммуникационных систем обработки информации. Представленный материал дает возможность приобрести навык в работе с выборками данных ограниченного объема. Результаты исследований могут служить основой для разработки специального программного обеспечения исследовательских работ. Пособие предназначено для бакалавров, специалистов и магистрантов направления «Сети связи и системы коммутации», «Радиоэлектронные системы и комплексы», «Инфокоммуникационные технологии и системы связи», а также для аспирантов, работающих в области проектирования и анализа структур информационновычислительных телекоммуникационных систем.
Самойленко, А. П. Информационные технологии статистической обработки данных : учебное пособие / А. П. Самойленко, О. А. Усенко ; Южный федеральный университет. - Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2017. - 126 с. - ISBN 978-5-9275-2521-8. - Текст : электронный. - URL: https://znanium.com/catalog/product/1021591 (дата обращения: 26.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

Федеральное государственное автономное образовательное

учреждение высшего образования

«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

Инженерно-технологическая академия

А. П. САМОЙЛЕНКО, О. А. УСЕНКО

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ

СТАТИСТИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ

Учебное пособие

Ростов-на-Дону – Таганрог

Издательство Южного федерального университета

2017

УДК 519.17: 621.39 (075.8)
ББК 22.176Я73

С173

Печатается по решению кафедры радиотехнических и телекоммуника
ционных систем Института радиотехнических систем и управления

(протокол №8 от 30.01.2017)

Рецензенты:

доктор технических наук, профессор, зав. кафедрой прикладной ма
тематики и информационных технологий Таганрогского института управ
ления и экономики В. П. Карелин

доктор технических наук, профессор, профессор кафедры систем автоматического управления Института радиотехнических систем 

и управления А. Р. Гайдук

Самойленко, А. П.

С173  
Информационные технологии статистической обработки дан
ных : учебное пособие / А. П. Самойленко, О. А. Усенко ; Южный 
федеральный университет. – Ростов-на-Дону ; Таганрог : Издательство Южного федерального университета, 2017. – 126 с.

ISBN 978-5-9275-2521-8
Исследуются информационные технологии построения и ана
лиза статистических моделей параметров радиотехнических и телекоммуникационных систем обработки информации. Представленный материал дает возможность приобрести навык в работе с выборками данных ограниченного объема. Результаты исследований 
могут служить основой для разработки специального программного 
обеспечения исследовательских работ.

Пособие предназначено для бакалавров, специалистов и маги
странтов направления «Сети связи и системы коммутации», «Радиоэлектронные системы и комплексы», «Инфокоммуникационные технологии и системы связи», а также для аспирантов, работающих в области 
проектирования 
и 
анализа 
структур 
информационно
вычислительных телекоммуникационных систем.

УДК 519.17: 621.39 (075.8)

ББК 22.176Я73

ISBN 978-5-9275-2521-8

© Южный федеральный университет, 2017
© Самойленко А. П., Усенко О. А., 2017
© Оформление. Макет. Издательство

Южного федерального университета, 2017

СОДЕРЖАНИЕ

ВВЕДЕНИЕ В ПРОБЛЕМУ СИНТЕЗА СТАТИСТИЧЕСКИХ 

МОДЕЛЕЙ РАДИОТЕХНИЧЕСКИХ И 
ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ……………………
5

1. МЕТОД АДДИТИВНОЙ АППРОКСИМАЦИИ ДАННЫХ 

ВЫБОРКИ ОГРАНИЧЕННОГО ОБЪЕМА……………………
10

1.1. Мониторинг выбросов случайных процессов контролируемых 

параметров…………………………………………………….….
10

1.2. Оценка критического объема выборок при традиционном 

подходе обработки стохастических массивов………………..
16

1.3. Принципы обработки статистических данных в базисе 

аддитивной аппроксимации стандартными
распределениями............................................................................

Контрольные вопросы……………………………..……..……...………
Тестовые задания……………………….……………………..……….…
2. ПОСТРОЕНИЕ ЭМПИРИЧЕСКОЙ МОДЕЛИ МАЛОЙ 

ВЫБОРКИ В БАЗИСЕ ВКЛАДОВ СИММЕТРИЧНЫХ 
РАСПРЕДЕЛЕНИЙ……………………………………………

21
28
30

32

2.1. Разработка методов аппроксимирующих вкладов значений 

выборки.................…………………………………………………
32

2.2. Разработка метода имитационного моделирования для 

идентификации вероятностных моделей параметров на основе 
статистик малых выборок……………………….………………
43

2.3. Оценка моментов стохастического массива малой выборки…..
45

Контрольные вопросы…………………………………….…………….
Тестовые задания………………………….………………..……………
3. КОМПЬЮТЕРНАЯ ПРИКЛАДНАЯ РЕАЛИЗАЦИЯ МЕТОДОВ ГРАФИКИ И ИМИТАЦИОННОГО МОДЕЛИРОВАНИЯ. 
КОМПЛЕКСНОЕ ЗАДАНИЕ……………………………………….…

46
47

49

3.1. Методические указания для домашнего задания……………...…
52

3.2. Описание интерфейса пользователя и методика проведения 

самостоятельной работы……………………………………...…..
53

3.3. Требования к отчету по самостоятельной работе………………..
68

3.4. Варианты индивидуального задания…………………………..…
69

Контрольные вопросы и методические указания…………………..….
Комплексное задание ………………………………………….………

71
73

4. ТЕХНОЛОГИЯ ОБРАБОТКИ ДАННЫХ ОГРАНИЧЕННОГО
ОБЪЕМА ИНСТРУМЕНТАРИЕМ ИНТЕРПОЛЯЦИОННЫХ 
ПОЛИНОМОВ………………………………………………………...…
75

4.1. Построение эмпирического случайного процесса посредством 

полиномной интерполяции…………………………….……………....
75

4.2. Выбор интерполирующей функции (полинома)………………
83

4.3. Исследование сходимости эмпирических функций 

распределения…………………………………………………......
96

4.4. Обработка данных об отказах РЭО с использованием 

эмпирического случайного процесса…………………………….
106

4.5. Прогнозирование показателей надежности………….……..……
115

Контрольные вопросы……………………………………………...…….
119

ЗАКЛЮЧЕНИЕ………………………………………………………...
121

СПИСОК ЛИТЕРАТУРЫ…………..………………………………....
123

ВВЕДЕНИЕ

В ПРОБЛЕМУ СИНТЕЗА СТАТИСТИЧЕСКИХ МОДЕЛЕЙ РА
ДИОТЕХНИЧЕСКИХ И ТЕЛЕКОММУНИКАЦИОННЫХ СИСТЕМ

В учебном пособии для изучения и применения предложены ин
формационные технологии построения статистических моделей параметров радиотехнических и телекоммуникационных систем в процессе их 
испытаний и эксплуатации. Представленный материал даст возможность 
студенту познакомиться и приобрести навык в работе с выборками данных ограниченного объема студентам специальности «Средства связи с 
подвижными объектами». Материал носит оригинальный характер и был 
апробирован при выполнении научно-исследовательских работ. Результаты исследований могут служить основой для разработки специального 
программного обеспечения в технических дисциплинах учебного плана, а 
также при обработке эмпирических данных в процессе выполнения лабораторных, курсовых и дипломных работ.

Одним из важных этапов в проектировании радиотехнических и те
лекоммуникационных систем (РТС) является разработка моделей окружающей среды, трафика передачи данных, процессов функционирования 
средств подвижной связи, поскольку исследование проектируемой системы путем экспериментирования с более простой и дешевой системой –
моделью – в инженерной практике всегда было наиболее эффективным 
средством.

При исследовании больших систем практически невозможен 

сколько-нибудь полный натурный эксперимент и крайне ограничены возможности аналитических и численных расчетов.

Под математической моделью системы понимается описание вза
имосвязи (числовой или логической) варьируемых параметров и выходных показателей при определенной совокупности входных воздействий.

Задача синтеза модели – выбор математического аппарата, изо
морфно описывающего моделирующий фрагмент, совокупность фрагментов, всю систему, выбор/определение ее параметров, удовлетворяющих 
предъявляемым к системе требованиям.

При построении моделей определяются математические перемен
ные, описывающие процессы смены состояния объектов, динамику изме
Введение в проблему синтеза статистических моделей…

6

нений входных, промежуточных и выходных сигналов системы, соотношений между ними. При этом могут быть выделены типовые задачи моделирования физических, организационно-экономических, информационных процессов РТС.

В детерминированных моделях математические переменные чаще 

всего отображаются системами дифференциальных и алгебраических выражений. В стохастических моделях процесс или действие объекта, среды 
описываются вероятностными уравнениями, и физический смысл имеют 
не отдельные реализации процесса, а совокупность реализаций и их параметры (законы распределений, математическое ожидание, дисперсия, 
корреляционные зависимости и т.п.).

Методы построения, исследования и использования математиче
ских моделей физических процессов чрезвычайно разнообразны и тесно 
связаны с особенностями объектно-ориентированного процесса. Поэтому 
весьма затруднительна формализация приемов разработки моделей физических процессов в общем виде без соответствующей конкретизации самого процесса. При разработке стохастических моделей имеется некоторая общность, в основном связанная с особенностью используемого математического аппарата, а именно теории случайных процессов, математической статистики, теории случайных выбросов. Так, при разработке моделей, отображающих процессы функционирования РТС, дисциплины 
обслуживания, восстановления различных по физической природе объектов используют математические методы теории массового обслуживания.

В состав прикладного программного обеспечения РТС обязатель
но входит подсистема исследования и моделирования. Она осуществляет 
системный анализ всей производственной деятельности системы и отдельных ее звеньев; производит математическое, имитационное моделирование для выработки рекомендаций по техническому и программному 
обеспечению. Как правило, подсистема состоит из пакета прикладных 
программ обработки данных методами математической статистики. Они 
реализуют генерацию случайных чисел; предварительную обработку исходных данных; вычисление статистических характеристик; корреляционный, регрессионный и спектральный анализ; построение эмпирических 
статистических моделей технологической среды, их идентификацию 

Введение в проблему синтеза статистических моделей…

7

стандартными распределениями при заданных критериях адекватности; 
статистический контроль качества производства и др.

Изучая особенности информационно-вычислительного комплекса 

(ИВК) РТС [1, 2], ориентированного на контроль и управление определенной технологической средой, следует обратить внимание на его связи 
в системе и на функционирование системы в целом. Поэтому, приступая к 
его проектированию, необходимо провести анализ технологической среды, для управления которой он создается. Исследованию подлежат такие 
характеристики, как количество и характер контролируемых параметров, 
время реакции технологической среды на управляющее воздействие, требуемая точность управления. Кроме них, важное значение имеет математическая модель поведения среды, модель функционирования системы –
совокупность соотношений, определяющих зависимости изменений регулируемых величин от входных воздействий, формируемых информационно-вычислительным комплексом.

Совокупность сигналов в процессе их движения в информацион
ном пространстве РТС и во времени от источников к потребителям называют потоком информации.

Чтобы определить (задать) поток, необходимо определить (за
дать) его количественные, качественные и временные характеристики. К 
ним относятся направление потока, интенсивность потока, структурный 
состав и количество информации [2, 3]. Характеристики потока определяются посредством статистической обработки эмпирических данных 
либо методами Монте-Карло и впоследствии используются при синтезе 
модели СМО.

Прикладная значимость статистических моделей в проектирова
нии РТС будет неполной, если не упомянуть решение задач оценки информационной надежности систем посредством статистических технологий обработки данных о смещении значений контролируемых параметров 
к (за) предельно допустимым под влиянием процессов износа, окружающей среды (режимов работы технологического оборудования, состояния 
самой РТС и т.п.) [4-7].

Напомним задачи статистического анализа. Основная цель стати
стического анализа состоит в исследовании свойств значений контролируемых параметров. Экспериментальной основой такого исследования 

Введение в проблему синтеза статистических моделей…

8

служат результаты измерения значений изучаемой случайной величины, 
которые обычно рассматриваются как случайная выборка из гипотетической генеральной совокупности.

Задачи статистического анализа обычно разделяют на следующие 

классы [18]:


статистическое оценивание;


построение и оценка статистических зависимостей;


проверка статистических гипотез.
Эти задачи существенно различаются как по внутреннему содер
жанию, так и по методам решения.

Задача оценивания всегда направлена на вычисление количе
ственных характеристик случайной величины по конечной выборке.

При проверке статистической гипотезы ставится цель – опреде
лить по выборке свойства случайной величины или их совокупности [8]. 
Решение этих задач рассматривалось в разделе «Математическая статистика» дисциплины «Теория вероятности и математическая статистика». 
Рассмотренные методы реализуются технологиями интервального оценивания и ориентированы на необходимость обработки значительного объема поступающей информации. На практике очень часто приходится работать в условиях ограниченных объемом выборок [13-15]. Особенно остро эта необходимость ощущается в условиях определения в реальном 
масштабе времени состояния контролируемых объектов, функционирующих в критических условиях, в производстве и эксплуатации дорогостоящих и высоконадежных технологических изделий, в службах контроля 
качества производства продукции. Применение традиционных технологий 
статистической обработки, основанных на интервальных методах, в этих 
условиях практически невозможно.

Таким образом, актуальна разработка и исследование новых тех
нологий обработки статистических массивов малой выборки (ограниченных по объему данных), основанных на точечных методах анализа, обработки и принятия решения по статистическому оцениваю и построению 
статистических зависимостей.

Анализ наиболее актуальных проблем синтеза статистических 

моделей радиотехнических и телекоммуникационных систем позволяет 
сделать следующие выводы [1-10]:

Введение в проблему синтеза статистических моделей…

9

1. Принципиальная особенность системного анализа – широкое 

использование на всех этапах проектирования РТС статистического моделирования. Модель является основным рабочим инструментом разработчика РТС.

2. Модель – это средство субъективного отображения реальной 

системы, а ее синтез – своеобразный процесс определения, представления 
общих свойств системы и закономерностей ее функционирования и развития.

3. Статистические модели отличают от других моделей следую
щие свойства [17, 18]:

– универсальность, позволяющая применять их для отображения 

различных по физической природе объектов и систем;

– возможность отображения и оценки влияния неконтролируемых 

параметров на управляемые;

– конструирование моделей производится на основе опытных 

данных результатов эксплуатации, натурных и имитационных испытаний.

4. Представляют прикладной интерес исследования технологий 

статистической обработки массивов данных ограниченной выборки методами точечной оценки [14, 15].

5. Для повышения достоверности результатов статистической об
работки данных малого объема целесообразно использовать альтернативный подход (например, с применением интерполяции) с последующим 
сравнением результатов.

1. МЕТОД АДДИТИВНОЙ АППРОКСИМАЦИИ ДАННЫХ 

ВЫБОРКИ ОГРАНИЧЕННОГО ОБЪЕМА

1.1. Мониторинг выбросов случайных процессов 

контролируемых параметров

Мониторинг выбросов случайных процессов контролируемых па
раметров РТС предлагается осуществлять с использованием подхода [9, 
10, 13], суть которого заключается в том, что с помощью квантования по 

уровню случайной функции xi (t, , S), характеризующей изменение во 
времени диагностируемого параметра, реальный процесс ухудшения 
функционирования РТС, выражающийся в отклонении (наличии выброса) 

значения параметра до j-го уровня 

q
j
,1

квантования, моделируется 

дискретным процессом, как это показано на рис. 1.

…

B
i1


B
iN


const

B
ix

в.ав
i
x

const
S

A i1

t
tопт

A iN

1
2
3

q

…

i
x

…

1


Рис. 1. Измерение характеристик выбросов хi параметра в диапазоне 

.
,
в
в ав

i
i
x
x



 посредством квантования на q уровней

Состояние РТС отображается совокупностью N непрерывных кон
тролируемых независимых параметров xi(t, , S) с соответствующими 

1.1. Мониторинг выбросов случайных процессов контролируемых…

11

значениями допусков 

в
н,
i
i
x
x
нижнего и верхнего уровней, которое мож
но представить в матричной форме [13, 23]:

1
1
1

в
2
2
2
х,
,
=
 

в
н

в
н

н

в
н

N
N
N

х
x
x

x
x
x
х
х

x
x
x

.
(1)

Постепенный отказ РТС сопровождается выходом значений k



1,
k
N

контролируемых параметров за пределы своих допусковых зон, 

тогда, применив пороговый оператор П(х) к каждой строке матрицы (1):




0

1

2

,

П
,
 

,

н
B

i
i
i
i

н
в

i
i
i
i
i
i

н
в

i
i
i
i

x
x
x

х
x
x
x

x
x
x





















,
(2)

где 
j
i
{0,1},
1,
,
0,2
i
N j
 


, получим булеву матрицу S состояний N кон
тролируемых параметров:

0
1
2

1
1
1
1

0
1
2

2
2
2
2

0
1
2

=
 

N
N
N
N

S

















.
(3)

С помощью порогового оператора (2) состояние i-го параметра 

отображается трехместным кодовым вектором 
0
1
2

i
i
i
i


 


 
 с одной 

единичной компонентой, положение которой в кодовом векторе 
i
опре
деляет характер порядкового соотношения между текущим xi(t, , S) значением i-го параметра и его допусковых уровней. Для каждого параметра 

1,
i
N

формируется дизъюнктивный индикатор выхода i-го параметра за 

Доступ онлайн
151 ₽
В корзину