Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Основы теории надежности систем

Покупка
Артикул: 752961.01.99
Доступ онлайн
2 000 ₽
В корзину
Рассмотрены основы теории надежности сложных систем и практические методы расчета показателей надежности в применении к информационным системам. Особое внимание уделено моделированию систем для оценки надежности. Показаны особенности применения аналитических моделей надежности и область применения статистических (имитационных) моделей. Дано подробное описание статистического эксперимента по определению показателей надежности, а также способы вычисления оценок точности и достоверности полученных результатов. Предназначено для бакалавров по направлению подготовки 09.03.02 «Информационные системы и технологии» и магистрантов по направлениям подготовки 09.04.01 «Информатика и вычислительная техника» и 09.04.03 «Прикладная информатика».
Смирнов, А. П. Основы теории надежности систем : курс лекций / А. П. Смирнов. - Москва : Изд. Дом НИТУ «МИСиС», 2018. - 118 с. - ISBN 978-5-87623-782-8. - Текст : электронный. - URL: https://znanium.com/catalog/product/1232200 (дата обращения: 26.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ 
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ  
ВЫСШЕГО ОБРАЗОВАНИЯ  
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ «МИСиС» 
 
ИНСТИТУТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ И АВТОМАТИЗИРОВАННЫХ СИСТЕМ 

 

 
 
 

 

 

 

 
 

 

№ 2333 

Кафедра автоматизированных систем управления

А.П. Смирнов 

ОСНОВЫ ТЕОРИИ 
НАДЕЖНОСТИ СИСТЕМ 

Курс лекций 

Рекомендовано редакционно-издательским 
советом университета 

Москва  2018 

УДК 004 
 
С50 

Р е ц е н з е н т  
канд. техн. наук, проф. Е.П. Потоцкий 

Смирнов А.П. 
С50  
Основы 
теории 
надежности 
систем : курс 
лекций / 
А.П. Смирнов. – М. : Изд. Дом НИТУ «МИСиС», 2018. – 118 с. 
ISBN 978-5-87623-782-8 

Рассмотрены основы теории надежности сложных систем и практические 
методы расчета показателей надежности в применении к информационным 
системам. Особое внимание уделено моделированию систем для оценки 
надежности. Показаны особенности применения аналитических моделей 
надежности и область применения статистических (имитационных) моделей. 
Дано подробное описание статистического эксперимента по определению 
показателей надежности, а также способы вычисления оценок точности и достоверности полученных результатов.  
Предназначено для бакалавров по направлению подготовки 09.03.02 
«Информационные системы и технологии» и магистрантов по направлениям 
подготовки 09.04.01 «Информатика и вычислительная техника» и 09.04.03 
«Прикладная информатика». 
УДК 004 

 
 А.П. Смирнов, 2018 
ISBN 978-5-87623-782-8 
 НИТУ «МИСиС», 2018 

ОГЛАВЛЕНИЕ 

1. Основные понятия теории надежности систем ................................. 6 
1.1. Два типа случайных воздействий................................................. 6 
1.2. Основные определения теории надежности систем ................... 9 
1.2.1. Надежность систем ................................................................. 9 
1.2.2. Формулировка цели системы .............................................. 10 
1.3. Показатели надежности элементов системы ............................ 12 
1.3.1. Теоретическое определение показателей надежности 
элементов ......................................................................................... 12 
1.3.2. Статистическая оценка показателей надежности  
элементов ......................................................................................... 15 
1.4. Показатели надежности системы ............................................... 16 
1.4.1. Понятие обслуживаемой системы ....................................... 16 
1.4.2. Функциональная надежность и надежность  
достижения цели ............................................................................. 17 
2. Статистические закономерности процессов отказа элементов 
системы .................................................................................................... 22 
2.1. Процесс отказа базового элемента ............................................. 22 
2.2. Процесс отказа функционального элемента ............................. 23 
2.3. Обоснование наиболее вероятного закона распределения 
интервала безотказной работы функционального элемента .......... 23 
2.4. Исследование поведения функции  t

 для различных  
законов распределения ....................................................................... 25 
2.5. Обсуждение адекватности различных законов  
распределения реальному функционированию элементов............. 30 
3. Аналитические модели функциональной надежности системы .... 33 
3.1. Понятие аналитических моделей надежности .......................... 33 
3.2. Теоретико-множественные основания вычисления  
показателей надежности .................................................................... 34 
3.2.1. Аксиомы теории вероятностей ............................................ 34 
3.2.2. Обоснование аксиом теории вероятностей ........................ 35 
3.2.3. Табличная форма представления сложного события ........ 37 
3.2.4. Аналитическое обоснование формул вычисления 
вероятности безотказной работы для простых моделей 
надежности ...................................................................................... 39 
3.3. Статические модели функциональной надежности ................. 43 
3.3.1. Понятие статической модели .............................................. 43 

3.3.2. Модель системы без резервирования элементов ............... 44 
3.3.3. Модель системы с параллельным включением  
резервных элементов ...................................................................... 45 
3.3.4. Модель системы с последовательным замещением 
элементов ......................................................................................... 46 
3.3.5. «Структура m из M» ............................................................. 47 
3.4. Динамические модели надежности системы ............................ 49 
3.4.1. Понятие динамической модели. Переход состояний ........ 49 
3.4.2. Динамическая модель надежности простейшей 
обслуживаемой системы ................................................................ 52 
3.4.3. Динамическая модель при неэкспоненциальных  
законах распределения интервалов ............................................... 56 
3.4.4. Динамическая модель надежности обслуживаемой 
системы из нескольких элементов ................................................ 60 
3.4.5. Пример записи уравнений Чепмена–Колмогорова  
и их решения для системы с обслуживанием .............................. 63 
3.4.6. Вычисление показателей надежности системы ................. 68 
4. Статистическое моделирование функциональной надежности 
системы .................................................................................................... 75 
4.1. Понятие имитационной модели надежности и принципы  
ее построения ...................................................................................... 75 
4.1.1. Определение имитационной модели надежности ............. 75 
4.1.2. Принципы построения алгоритма ....................................... 76 
4.1.3. Описание алгоритма имитационной модели ..................... 77 
4.1.4. Воспроизведение случайных интервалов ........................... 82 
4.2. Точность и достоверность оценок показателей надежности  
по статистическим данным ................................................................ 84 
4.2.1. Закон распределения оценки p* вероятности события  
и расчет доверительных интервалов ............................................. 84 
4.2.2. Оптимальность оценки p* .................................................... 88 
4.2.3. Оптимальная оценка среднеквадратичного  
отклонения σ*[p*] ............................................................................ 90 
4.2.4. Достоверность законов распределения интервалов .......... 94 
4.3. Проведение имитационного эксперимента на модели ............. 98 
4.3.1. Исходные данные и план эксперимента ............................. 98 
4.3.2. Оценка адекватности имитационной  и аналитической 
моделей .......................................................................................... 100 

4.3.3. Результаты имитационного моделирования  
надежности системы с неэкспоненциальными  
законами распределения интервалов .......................................... 102 
4.3.4. Исследование стационарности  потока отказов  
системы при неэкспоненциальных законах распределения 
интервалов ..................................................................................... 106 
4.3.5. Проверка гипотез о виде закона распределения  
интервала до отказа ...................................................................... 108 
4.3.6. Вычисление закона распределения интервала  
безотказной работы системы ....................................................... 111 
4.4. Обсуждение основных целей и результатов  
имитационного моделирования....................................................... 114 
Библиографический список ................................................................. 117 
 

1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ 
НАДЕЖНОСТИ СИСТЕМ 

1.1. Два типа случайных воздействий  

Усложнение и количественный рост задач, связанных с удовлетворением потребностей человека, привели к соответствующему 
усложнению технических и технологических систем, создаваемых 
для решения этих задач. Большие затраты при создании системы, 
часто ее уникальность, а также ожидаемый эффект от решения задачи делают недопустимым срыв этого решения как результат воздействия случайных факторов. Поэтому надежность системы – это один 
из главных критериев, по которым оценивается качество системы. 
Итак, надежность системы зависит от действия случайных факторов. 
Можно выделить два различных типа случайных воздействий. 
Рассмотрим их на примерах. 
Пример 1: лампочка накаливания. Раскаленная металлическая 
спираль подвешена в вакууме. В результате постепенного поверхностного испарения спираль становится все тоньше, пока в какомнибудь месте не достигнет критического сечения. Место перегорания 
зависит от случайного расположения дефектов микроструктуры материала. Время до перегорания зависит от случайных скоростей испарения, также связанных с указанными дефектами микроструктуры. 
Пример 2: автомобиль. Несущие и ходовые металлические конструкции автомобиля испытывают механические нагрузки, приводящие к постепенному развитию микротрещин, первоначально имеющихся в металле вследствие несовершенства технологии. В конце 
концов, какая-нибудь деталь ломается. Время и место поломки зависит от нагрузки и случайного расположения микротрещин. 
Пример 3: конвертер. Огнеупорная кладка конвертера день за 
днем выгорает случайным образом в зависимости от дефектов структуры огнеупорного кирпича, поверхности и случайного температурного поля. Если не производить предупредительных ремонтов, через 
некоторое время произойдет авария. 
Пример 4: интегральная схема. Находясь под постоянным воздействием случайных электромагнитных полей, колебаний температуры и влажности, интегральная схема постепенно приобретает механические дефекты, а потом и дает функциональные сбои. 

Замечание. Если рассматривать расположение микроэлементов в 
структуре материала указанных конструкций как систему, то можно 
сказать, что случайность здесь заложена в структуру системы. Она 
проявляется в надежности посредством действия нагрузки. Здесь характерно относительно большое время функционирования до отказа 
и эволюционный характер развития дефектов под действием нагрузки. При этом сама нагрузка может быть как случайной, так и регулярной. Это не существенно, так как эффект ее действия, в основном, 
является интегральным по времени. Таков первый тип действия случайных факторов. Их можно назвать внутренними. Это неподдающиеся контролю дефекты технологии, возникшие в процессе изготовления изделия. 
Рассмотрим примеры второго типа действия. 
Пример 5: космический летательный аппарат. Попав в поток метеоритов, аппарат получает сильный удар в обшивку. В результате 
компьютер дает временный сбой и на две секунды отключается приемник сигналов управления. Но именно в этот момент приходит сигнал на коррекцию траектории. Коррекция не проводится, задание не 
выполнено. 
Пример 6: участок «сталь–прокат» с разливкой в изложницы. 
Начинается выполнение суточного графика, в котором указаны моменты выпуска плавок в конвертерном цехе, марки стали и типы изложниц. Это определяет порядок дальнейшей обработки плавок. В 
результате погрешностей при взвешивании и химическом анализе 
шихты происходят сбои по маркам стали, меняющие очередь плавок. 
В результате разницы во времени кристаллизации скапливается 
непредвиденная очередь в стрипперном отделении. Часть плавок переохлаждается и дольше, чем планировалось, занимает место в ячейках нагревательных колодцев. Имеются случайные вариации времени раздевания слитков и транспортировки составов с плавками. В 
результате напряженной обстановки на разливочной площадке возникает привар слитков, что усугубляет трудности стрипперного отделения. Освобожденные от слитков составы опаздывают к запланированному началу сборки и транспортировки на разливочную площадку. В результате суточный график не выполнен, хотя все агрегаты работали исправно. 
Пример 7: компьютерная сеть. Из-за внешних радиопомех в линиях связи в сети возникают необнаруживаемые ошибки, приводящие к временному нарушению работы системы коммутации пакетов. 
Это приводит к скоплению их на коммутаторах и увеличению време
ни обработки. В результате срочные пакеты задержаны. Это равносильно отказу и влечет штрафные санкции. 
Замечание. В примерах 5–7 система во время функционирования 
находится в поле действия внешних случайных факторов, которые 
могут нарушать или не нарушать исправное состояние элементов 
системы, но в любом случае могут привести к невыполнению системой ее задачи. 
Подводя итоги сказанному, заметим, что первый тип действия 
случайных факторов характерен для элементов систем и связан с их 
физическими свойствами. Надежность при этом может повышаться 
совершенствованием технологии изготовления материалов и конструкции. Второй же тип характерен для самих систем в процессе их 
функционирования. Надежность здесь может быть повышена не 
столько за счет изменения структуры системы, сколько за счет совершенствования подсистемы получения и обработки информации о 
действии случайных факторов и совершенствования подсистемы 
управления. Указанные подсистемы являются, как правило, функциональными элементами автоматизированных систем. 
Автоматизированная система включает в себя одну или несколько 
автоматических подсистем, способных действовать автономно, и человека, находящегося во взаимодействии с этими подсистемами и 
имеющего функции контроля состояния и управления (включая изменение архитектуры системы). 
Условно можно разделить все системы на производственные и 
непроизводственные, считая производственной ту систему, которая 
производит некоторый товар. Примером непроизводственной системы является оборонная система. Поскольку и информация в настоящее время является товаром, то в указанной классификации информационные системы можно было бы отнести к производственным. 
Аналогия особенно сильно видна в сетях (где пакеты проходят «технологическую обработку»), если учесть, что общие свойства производственных систем (включая свойство надежности) нужно искать 
на уровне моделей массового обслуживания. Однако в информационных системах есть технологические особенности, отличающие их 
от производственных систем. 
В данном курсе лекций рассматриваются теоретические проблемы 
оценки надежности систем. 

1.2. Основные определения теории надежности систем 

1.2.1. Надежность систем 

Определение 1. Надежность – это свойство системы противостоять случайным внешним воздействиям, препятствующим достижению поставленной перед системой цели. 
Для того чтобы система могла теоретически достигнуть цели, она 
должна в первую очередь быть в работоспособном состоянии. Это 
означает, что должен функционировать хотя бы некоторый минимальный набор элементов и связей. 
Определение 2. Минимальный набор элементов и связей, который обеспечивает движение системы к цели, называется функционально необходимым набором. 
Само движение обеспечивается управляющей подсистемой, в которую заложен алгоритм управления. Этот алгоритм в связи с действием случайных факторов не может полностью гарантировать достижение цели, даже если все его функции выполняются нормально. 
В этой связи говорят о надежности управления. 
Определение 3. Надежность управления – свойство алгоритма 
управления нейтрализовать влияние случайных факторов и обеспечить достижение цели при условии, что имеется функционально необходимый набор. 
Для сложной системы существует обычно не одно, а множество 
работоспособных состояний. Таким образом, факт выполнения системой поставленной задачи является сложным событием, состоящим в достижении цели при условии, что система находится в одном 
из работоспособных состояний. 
Для обеспечения работоспособного состояния системы каждый из 
элементов функционально необходимого набора должен выполнять 
свою функцию. Под элементом понимают отдельное техническое 
устройство, а иногда и подсистему, состоящую из нескольких 
устройств, что определяется обычно целями расчетов и применяемыми методами. 
Определение 4. Выполнение функции состоит в том, что некоторые важные технические (или технологические) выходные параметры находятся в пределах, заданных техническими условиями, т.е. 
обеспечивающих функционирование других элементов. Например, 
блок питания вычислительного комплекса должен поддерживать с 
определенной точностью свои выходные напряжения и частоты. Вы
числительный комплекс, периодически решающий задачу управления, обязан выдавать решение внутри ограниченного интервала времени. 
В конструкции каждого технического устройства имеются нерасчленяемые (базовые) элементы с определенными физическими свойствами, предназначенные для относительно длительной работы. Длительность их работоспособного состояния определяется технологией 
изготовления и точностью поддержания заданных условий функционирования. Надежность таких элементов определяется (согласно 
ГОСТу) как способность выполнять требуемую функцию в заданных 
условиях в течение заданного периода времени. 
Фундаментальным понятием при определении надежности является понятие отказа, которое для конкретного объекта должно дать 
возможность отделить состояние отказа от работоспособного состояния. Для базового элемента – это, как правило, бывает очевидно. 
Определение 5. Отказом базового элемента называется потеря 
свойства выполнять требуемую функцию. 
Определение 6. Для более или менее сложного устройства, являющегося элементом системы, отказом называется выход хотя бы одного функционального параметра из заданных пределов. 
Определение 7. Отказом системы называется событие, состоящее 
в том, что система не достигает поставленной цели. 

1.2.2. Формулировка цели системы 

Для уточнения определения отказа системы необходимо сформулировать ее цель. Это обычно делается индивидуально для конкретного экземпляра системы. 
Пример 1. Для информационной системы (ИС), решающей задачу 
коррекции траектории одноразового космического аппарата для исследования Венеры, цель может быть сформулирована так: выдать 
результат решения не позднее очередного момента коррекции траектории. В противном случае аппарат может быть потерян. 
Пример 2. Конвертерный цех, представляющий собой производственную систему (ПС), может произвести 55 плавок в сутки. По 
графику он должен сделать за сутки 50 плавок десяти различных марок стали с определенным числом плавок по каждой марке. Предположим, что ставится цель: произвести по каждой марке не меньше 
плавок, чем в графике (а такие цели реально ставятся). Ясно, что цех 
всегда работает вблизи своих предельных возможностей по мощно
сти. Кроме того, вероятность сбоя по марке стали достаточно велика. 
Нужно отметить, что ПС всегда имеет в своем составе информационную систему. Иначе нельзя осуществить управление. 
Замечание. Вероятность отказа в данной ситуации практически 
равна единице, каковы бы ни были ухищрения с управлением. Следовательно, классическая теория вероятностей в этом случае не позволяет объективно оценить надежность и ничего не дает для улучшения работы системы. 
Каков же выход из положения? А он уже давно найден, вопреки 
приведенной выше некорректной, но очень распространенной формулировке цели. Разработана премиальная система, лишающая персонал части премии за недовыпуск определенного количества плавок 
из графика. Поэтому на самом деле работники цеха не выбиваются 
из сил в каждые сутки, пытаясь достичь невозможного, а идут на 
компромисс между затратами своих усилий и денежным вознаграждением в среднем за месяц. 
Так работает реальная ПС. Каков же аппарат целеполагания (или 
формулировки цели)? Оказывается, что здесь формулируется (часто 
несознательно, стихийно) так называемая нечеткая или размытая 
цель. Сочетание это звучит парадоксально для производства. Но понятие нечеткой цели давно существует в приложениях теории нечетких множеств. 
Сложные системы должны быть гибкими при формулировке тактических целей, так как они живут достаточно долго и стратегические цели могут быть достигнуты разными способа. Поэтому при 
формулировке тактической цели нецелесообразно планировать достижение только какого-либо маловероятного результата (даже, если 
он очень заманчив). Гораздо разумнее допустить и достижение других результатов, менее привлекательных (или полезных), но более 
вероятных. 
Итак, для определенных сложных систем (в том числе, для ПС) 
способ формулировки цели должен быть следующим. Выбирается 
некоторый количественный параметр, определяющий результат 
функционирования системы, интересный для среды (например, месячный объем производства изделий данного вида). Эксперты, представляющие интересы среды, устанавливают для каждого из множеств значений выбранного параметра значения некоторой функции, 
отражающей уровень приемлемости данного значения параметра. 
Если значения функции выражены словесным (качественным) описанием, они переводятся в количественный (числовой) вид путем 

аппарата лингвистических переменных, разработанного Л. Заде. Полученная числовая функция называется функцией принадлежности 
нечеткой (размытой) цели. Соответственно, отказ в этом случае 
называется нечетким. 
Определение 8. Нечетким отказом системы называется событие, 
которое состоит в том, что система не достигает своей нечеткой цели. 
Теория надежности развивается для проектирования и построения 
систем с максимальной надежностью, а также для разработки алгоритмов управления, обеспечивающих в существующих системах 
надежное достижение цели. Количественная мера надежности, необходимая для этих задач, выражается в так называемых показателях 
надежности. К их рассмотрению мы и переходим. Поскольку надежность системы (в смысле достижения цели) зависит, в том числе и от 
надежного функционирования элементов, рассмотрим вначале показатели надежности элементов. 

1.3. Показатели надежности элементов системы 

1.3.1. Теоретическое определение показателей 
надежности элементов 

В основе нарушения работоспособности (отказа) элемента лежит 
некоторый физический процесс, протекающий во времени с той или 
иной интенсивностью. Природа этого процесса индивидуальна для 
различных типов элементов и слишком сложна для аналитического 
описания. Поэтому события, связанные с появлением отказа, описываются на уровне некоторой обобщенной модели, оперирующей случайными интервалами времени функционирования и их распределениями. Параметры распределений оцениваются по результатам статистических испытаний элементов на надежность. 
Обозначим через  случайный интервал времени от момента 
включения элемента в работу до момента отказа. Момент включения 
будем считать нулем времени. Обозначим через t текущее время в 
том же измерении. Неоднократные испытания элементов различной 
физической природы привели к выводу, что  обладает статистической устойчивостью и имеет смысл распределение 

 
 


Bep
p t
t

 
, 
(1.1) 

являющееся базовой функцией для определения показателей надежности. 

Определение 9. Функция 
 
p t  называется вероятностью безотказной работы. 
Очевидно, что по определению эта функция обладает следующими свойствами: 

 
 
 
1
2
p t
p t

, если 2
1
t
t

.  

Определение 10. Функция 

 
 
 


1
Bep
F t
p t
t
 

 
 
(1.2) 

называется вероятностью отказа элемента. 
Значения 
 
F t  или 
 
p t  в достаточной мере характеризуют 
надежность отдельного элемента. Но когда элемент включен в длительно работающую систему, нас интересует, сможет ли система, 
исправно работающая до момента t , выполнить некоторое задание 
на интервале ( ,
)
t t
t
 
.  
Соответственно, для каждого элемента системы нас интересует 
условная вероятность того, что элемент откажет в течение интервала 
 , при условии, что уже работал в течение времени t . Обозначим эту 
вероятность через 


,t
 
 и вычислим ее. 

Замечание. Событие: «элемент не отказал до момента 
»
t  
 эквивалентно произведению (пересечению) двух событий: «элемент 
работал до момента t » и «элемент не отказал на интервале 

,t t    
при условии, что до момента t  он также не отказал». 
Вероятность последнего события, очевидно, равна 


1
,t
  
. 

Следовательно, вероятность исходного сложного события 


p t    
равна произведению вероятностей составляющих событий: 

 


 




1
,
.
p t
p t
t
  
  
 
(1.3) 

Отсюда 

 





 

,
1
.
p t
t
p t

 
 
 
 
(1.4) 

Для прогноза будущей надежности элемента (а в дальнейшем и 
системы) на момент t  интересно знать скорость уменьшения надеж
Доступ онлайн
2 000 ₽
В корзину