Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Численный вероятностный анализ неопределенных данных

Покупка
Основная коллекция
Артикул: 632464.01.99
Добронец, Б. С. Численный вероятностный анализ неопределенных данных/ДобронецБ.С., ПоповаО.А. - Краснояр.: СФУ, 2014. - 168 с.: ISBN 978-5-7638-3093-4. - Текст : электронный. - URL: https://znanium.com/catalog/product/549444 (дата обращения: 24.04.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.
Б. С. Добронец
О. А. Попова

Монография

Институт космических и информационных технологий

чиСленный 
верОятнОСтный АнАлиз
неОПреДеленных ДАнных

Впервые изложен подход к использованию численного вероятностного анализа для решения задач с 
неточными входными данными. Основное внимание 
уделено численному решению  систем линейных алгебраических уравнений и нелинейных уравнений,  
а также задачам оптимизации и прогнозирования. 
Разработанные алгоритмы могут быть использованы 
для исследования сложных систем с входными данными, заданными различными типами неопределенности.

9 785763 830934

ISBN 978-5-7638-3093-4

Министерство образования и науки
Российской Федерации
Сибирский федеральный университет

Б.С. Добронец, О.А. Попова

Численный вероятностный анализ

неопределенных данных

монография

Красноярск
СФУ
2014

УДК 517.972.9
ББК 22.193

Рецензенты:

Ю.И. Рогозов, д-р техн. наук, проф., зав. кафедрой САиТ ЮФУ;

Г.A. Доррер, д-р техн. наук, проф., зав. кафедрой систетемотехники СибГТУ

Добронец, Б.С.
Д 564 Численный вероятностный анализ неопределенных данных: монография / Б.С. Добронец, О.А. Попова — Красноярск: Сиб. федер. ун-т, 
2014. — 168 с.

ISBN 978-5-7638-3093-4

Впервые изложен подход к использованию численного вероятностного
анализа для решения задач с неточными входными данными. Основное
внимание уделено численному решению систем линейных алгебраических
уравнений и нелинейных уравнений, а также задачам оптимизации и прогнозирования. Разработанные алгоритмы могут быть использованы для исследования сложных систем с входными данными, заданными различными
типами неопределенности.
Предназначена для специалистов, работающих в области решения задач с неточными входными данными, в условиях их неопределенности и
неоднозначности. Может быть полезной для студентов, магистрантов и аспирантов.

УДК 517.972.9
ББК 22.193
c⃝
Сибирский федеральный
университет 2014
ISBN 978-5-7638-3093-4

Оглавление

Предисловие
6

Введение
16

1. Элиторная неопределенность
25
1.1. Эмпирическая функция распределения
. . . . . . . . . . . .
27
1.2. Дискретная (квантильная) оценка функции распределения .
28
1.3. Гистограммы . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
1.4. Полиграмма . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
1.5. Восстановление плотности распределения методом Розенблатта–
Парзена . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
1.6. Проекционные методы . . . . . . . . . . . . . . . . . . . . . .
32

2. Интервальное представление неопределенности
33
2.1. Интервальные числа . . . . . . . . . . . . . . . . . . . . . . .
33
2.2. Интервальные расширения
. . . . . . . . . . . . . . . . . . .
35
2.3. Интервальные сплайны
. . . . . . . . . . . . . . . . . . . . .
39
2.4. Интервальные интегралы . . . . . . . . . . . . . . . . . . . .
49
2.5. Интервальные СЛАУ
. . . . . . . . . . . . . . . . . . . . . .
53

3. Интервальные функции распределения (P-boxes)
61
3.1. Разложение интервальной функции распределения
. . . . .
63
3.2. Декартово произведение . . . . . . . . . . . . . . . . . . . . .
65
3.3. Независимость переменных . . . . . . . . . . . . . . . . . . .
67
3.4. Сжатие
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
68
3.5. Агрегация . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
69
3.6. Критика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
3.7. Гистограммные функции распределения . . . . . . . . . . . .
71

3

4. Элементы численного вероятностного анализа
74
4.1. Способы представления функций плотности случайных величин
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
75
4.2. Гистограммные переменные . . . . . . . . . . . . . . . . . . .
76
4.3. Законы распределения функций случайных аргументов . . .
77
4.4. Операции над плотностями вероятности случайных величин
78
4.5. Тестирование. Сравнение с методом Монте-Карло . . . . . .
83
4.6. Вероятностные расширения . . . . . . . . . . . . . . . . . . .
84
4.7. Решения систем линейных алгебраических уравнений . . . .
87
4.8. Решения нелинейных уравнений . . . . . . . . . . . . . . . .
91
4.9. Задачи интерполяции
. . . . . . . . . . . . . . . . . . . . . .
94

5. Гистограммные временные ряды
97
5.1. Основы гистограммных временных рядов . . . . . . . . . . .
100
5.2. Оценка погрешности для гистограммных временных рядов .
101
5.3. Использование метода k − NN для прогноза временных рядов102
5.4. Адаптация метода k − NN
. . . . . . . . . . . . . . . . . . .
103
5.5. Построение прогноза . . . . . . . . . . . . . . . . . . . . . . .
104
5.6. Метод расщепления
. . . . . . . . . . . . . . . . . . . . . . .
104
5.7. Численный пример . . . . . . . . . . . . . . . . . . . . . . . .
104
5.8. Временная агрегация . . . . . . . . . . . . . . . . . . . . . . .
105

6. Случайное программирование
109
6.1. Введение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
109
6.2. Постановка задачи . . . . . . . . . . . . . . . . . . . . . . . .
113
6.3. Случайное линейное программирование . . . . . . . . . . . .
114
6.4. Случайное нелинейное программирование . . . . . . . . . . .
117
6.5. оптимизации выработки электроэнергии гидроэлектростанцией в условиях неопределенности . . . . . . . . . . . . . . .
119

7. Регрессионный анализ
124
7.1. Агрегация данных . . . . . . . . . . . . . . . . . . . . . . . .
126
7.2. Регрессионное моделирование на основе агрегированных данных . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
129
7.3. Классическая параметрическая регрессия . . . . . . . . . . .
131
7.4. Метрики в пространстве гистограмм . . . . . . . . . . . . . .
131
7.5. Гистограммная регрессия . . . . . . . . . . . . . . . . . . . .
132
7.6. Численный пример . . . . . . . . . . . . . . . . . . . . . . . .
133

4

8. Процедуры распространения неопределенностей
136
8.1. Анализ существующих подходов к представлению и распространению неопределенности . . . . . . . . . . . . . . . . . .
136
8.2. Распространение неопределенности на основе численного вероятностного анализа
. . . . . . . . . . . . . . . . . . . . . .
138
8.3. Арифметика неопределенных данных на основе гистограмм
второго порядка
. . . . . . . . . . . . . . . . . . . . . . . . .
140
8.4. Показатели надежности сложных объектов . . . . . . . . . .
144

9. Технология информационной поддержки принятия инвестиционных решений
149
9.1. Оценки рисков . . . . . . . . . . . . . . . . . . . . . . . . . .
150
9.2. Расчет NPV и IRR . . . . . . . . . . . . . . . . . . . . . . .
150
9.3. Пример использования . . . . . . . . . . . . . . . . . . . . . .
154

Список литературы
157

5

Предисловие

Исследователям и практикам хорошо известно, что при получении неопределенной информации (что довольно часто и происходит в реальной
практике) проведение дальнейших исследований и решение поставленных
задач требует более адекватных методов представления исходной информации и более сложных методов расчета. Например, для руководителей
и специалистов в различных сферах практической деятельности, принимающих ответственные управленческие решения, важно получить ответ
на вопрос: «Можно ли на основе имеющейся информации получить достоверные данные и установить с помощью численных расчетов, достаточно
полезную и реалистичную картину последствий принимаемых управленческих решений, несмотря на тот факт, что информация, на основе которой
принимается решение, носит существенно неопределенный характер?». Ответить на этот вопрос — это значит проанализировать множество аспектов,
связанных как с понятием неопределенной информации, так и собственно
с самими численными методами, моделями и процедурами, необходимыми
для реализации всех стадий информационного процесса. Важно отметить,
что при осуществлении вычислительных процедур над неопределенными
данными с помощью численных методов представления, обработки, моделирования и численных расчетов могут быть установлены дополнительные
неопределенности, которых нет в изначальной постановке. Следует также
указать на необходимость изучения ограничений применимости методов,
используемых для практических расчетов с неопределенными значениями.
Исследователям и практикам также необходимо иметь в виду, что при
разработке и применении численных методов на основе неопределенных
данных должен обеспечиваться определенный уровень надежности и доверия к полученным результатам, прозрачности, полноте, релевантности и
понятности допущений относительно способов представления информационной неопределенности и ограничений для реализуемых численных процедур.
Поэтому изучение способов и разработка новых форм представления

6

информационной неопределенности в данных, применение численного моделирования на основе новых численных методов и подходов и разработка
новых методов, реализующих перечисленные выше аспекты, представляет
собой актуальную задачу.
Актуальность такой постановки проблемы подтверждается требованиями многих норм действующего российского законодательства, рядом российских и зарубежных стандартов. Любые действия, предпринятые по причине неточности или неполноты данных, увеличивают надежность полученной актуарной информации.
Как показал анализ литературы, проблема снижения уровня неопределенности в исходных данных и повышение эффективности численных методов представления, обработки, моделирования и анализа в течение многих десятилетий находится в центре внимания и остается предметом многих научных исследований. Достаточно отметить работы Ф.П. Тарасенко
«О роли ошибок в управленческой деятельности». Вместе с тем можно с
уверенностью утверждать, что данная проблема попрежнему актуальна и
составляет предмет исследования многих ученых. Наиболее значимые результаты в данной предметной области были получены учеными: B. Liu, F.
Scott, A. Neumaier, H. Schjaer-Jacobsen, D. Dubois, О.И. Ужга–Ребровым.
Проблемам принятия экономических решений в условиях неопределенности, в частности проблемам методологии представления неопределенных
данных, моделированию в условиях неопределенности и решению задачи
оптимального выбора в условиях интервально определенных цен, посвящены работы Д.В. Давыдова, А.А. Тарасова. Проблема повышения эффективности принятия инвестиционных решений, задача оценки инвестиционных проектов с учетом факторов риска и неопределенности рассматривается в работах А.М.Дыбова, А.В. Лукашова. В частности, в работах
А.М.Дыбова анализируются достоинства и недостатки различных методов формализации неопределенности, в том числе вероятностного, нечеткомножественного и экспертного. На основе результатов проведенного анализа выдвигается ряд предположений по их оптимальному применению.
Изучению альтернативных методов решения задачи принятия эффективных инвестиционных решений, в частности оценке инвестиционных проектов условиях высокой неопределенности и риска, посвящены исследования
А.В. Лукашова, на практических примерах им демонстрируется применение метода Монте-Карло для численных расчетов NPV инвестиционных
проектов и оценки чистой приведенной стоимости с целью определения
привлекательности инвестиционных проектов.

7

Среди зарубежных публикаций проблеме представления неопределенностей в данных и численным процедурам расчета посвящены работы, Б.С.
Добронца [66, 68], R. C. Williamson [54], D. Berliant [8], Jianzhong Zhang,
где рассматриваются интервальная, вероятностная и нечеткая неопределенность в данных и соответствующие арифметики над ними. Вводится
как отражение специфических свойств экономических данных понятие экономической неопределенности. Изучению свойств информации в условиях
неопределенности, способам и процедурам ее представления, обработки в
условиях элиторной и эпистемистической неопределенности посвящены работы D. Dubois [12], H. Prade, A. Neumaier [38] и S. Ferson [23]. Численные
модели и методы обработки неопределенной информации рассматриваются в работах S. Ferson [24], в частности ряд его публикаций посвящены
вопросам применения и изучения эффективности метода Монте-Карло к
задачам с различными типами неопределенности [22].
В настоящее время понятие неопределенности получило специализированный подтекст. Например, в работах H. Schjaer-Jacobsen [41] вводится
понятие экономической неопределенности, где исследуются представления
экономической неопределенности с помощью интервалов, нечетких чисел и
вероятностей, в том числе квадратичных, кубических, и четырех степенных
оценок и обсуждаются проблемы применения четырех основных арифметических операций к неопределенным экономическим показателям. В данной статье авторы пишут, что заинтересованы главным образом в представлении и расчете экономической неопределенности, т. е. в арифметике
неопределенных значений применительно к экономическим проблемам.
Отсутствие объективной и полной информации о распределении параметров приводит к необходимости рассматривать специальные методы и
подходы работы с данными. Для представления случайных величин и работы с ними определенное удобство представляют гистограммные числа
и соответственно гистограммная арифметика. Исследованию и применению гистограммной арифметики посвящен ряд работ. Среди первых публикаций по данной тематике следует назвать работы Б.С. Добронца [66].
В настоящее время арифметики для работы со случайными величинами
развиваются в следующих направлениях: интервальный анализ [33, 34] и
интервальная арифметика, нечеткая арифметика.
Одним из факторов, влияющих на качество принимаемых решений, является уровень неопределенности информации. Уровень неопределенности
информации определяет различные подходы и методы. Выделяют уровни
и типы неопределенностей. Например, H. Schjaer-Jacobsen [41] определяет

8

несколько уровней неопределенности, где самый низкий уровень неопределенности соответствует ситуации «полная» информированность — точный результат. Более высокий уровень неопределенности предполагает наличие некоторого вероятностного пространства. Существующая неопределенность информации отражается в данных как неопределенность данных.
Можно выделить три типа неопределенных данных: случайные, нечеткие
и интервальные. Случайные числа задаются некоторыми вероятностными
распределениями их возможных значений; нечеткие данные — лингвистически сформулированными распределениями их возможных значений; интервальные данные — интервалами их возможных значений без указания
какого-либо распределения возможных значений внутри заданного интервала. Очевидно, что интервальные данные содержат минимальную информацию о границах изменения неопределенного параметра или его принадлежности некоторому интервалу. В этом случае говорят об интервальной
неопределенности как о состоянии неполного (частичного знания) об интересующей нас величине. В качестве примера можно привести интервальную неопределенность спроса на произведенную продукцию.
Особый интерес в рамках работы с неопределенными данными представляют два вида неопределенностей, а именно: элиторная и эпистемическая.
Неопределённость, которая является неотъемлемым атрибутом случайных
событий, называют элиторной (aleatory) неопределённостью. Теория вероятностей предназначена для моделирования, оценки и оперирования именно элиторными неопределённостями. В свою очередь, неопределённость самих вероятностных оценок называют эпистемической неопределённостью
(epistemic uncertainty). Эпистемическая неопределённость прямо связана с
объёмом и достоверностью информации, на основании которой получаются
эти оценки.
Анализ публикаций по данной тематике позволил выделить шесть основных направлений в изучении эпистемической неопределенности. Первый подход отражает субъективную природу эпистемической неопределенности, когда необходимая информация, снижающая уровень неопределенности и необходимая для получения вероятностных оценок, зависит от
субъекта. В этом случае используются экспертные оценки. Вместо задания значения вероятности осуществления события эксперт задает некоторое множество таких значений и приписывает каждому значению вероятность его истинности. Чтобы получить точечную оценку вероятности
события, рассчитывается математическое ожидание полученного распределения. Подход второй — интервальный, связан с возможностью для по
9

строения вероятностных оценок использовать информацию о граничных
(интервальных) значениях оцениваемых характеристик. Эти методы сложны и достаточно широко представлены в рамках интервального анализа
R.Moore [33], A. Neumaier [37]. Подход третий — анализ вероятностной чувствительности имеет исключительно прикладной характер B. (Liu [21]). В
конкретной предметной задаче производится субъективное оценивание вероятностей релевантных событий. На основе полученной информации решается задача и получаются требуемые конечные результаты. После этого
исходные значения вероятностей варьируются в заданных пределах и оценивается влияние этого варьирования на конечные результаты. Анализ вероятностной чувствительности нашел широкое распространение, особенно
в задачах принятия решений.
Подход четвертый — теория Демпстера-Шефера (Dempster-Shafer Theory
of Evidence)[46]. Эта теория является расширением теории вероятностей
на случай, когда пространство случайных событий состоит не из синглетонов, а может включать в себя некоторые подмножества событий. Теория
Демпстера-Шефера позволяет справиться с такими задачами, в которых
теория вероятностей принципиально неприменима.
Подход пятый это метод распространения вероятностей и связан с понятием сети уверенностей. Он был предложен Ю. Пирлом и представляет
эффективное средство моделирования исходных неопределенных ситуаций
во многих приложениях искусственного интеллекта и в теории принятия
решений [43].
Шестой подход опирается на понятие вероятности второго порядка и
известен как second-order probability. Данный подход представляет собой
метод, позволяющий строить вероятностные оценки в случае эпистемической неопределенности. Концепция вероятностей второго порядка была изложена в 1996 году в работах A. Mosleh и V. M. Bier [36].
Анализ публикаций показал, что несмотря на то, что данное направление достаточно активно развивается за рубежом, понятие вероятности
второго порядка еще находится в стадии определения.
В настоящее время разрабатывается подход, который в отечественной
специализированной литературе получил название распространение неопределенности, а в зарубежных источниках звучит как propagation of uncertainty.
Анализируя содержательный смысл этого понятия, можно выделить такой
важный аспект процедуры распространения неопределенности, как способ
получения дополнительных оснований (знаний) для исследования входных
данных. Другими словами, если исследователь находится в условиях недо
10

статочности или полного отсутствия эмпирической информации или оснований для выдвижения идей и предположений о неизвестном распределении входных параметров, то необходимо распространить (propagate) существующую неопределенность, чтобы получить достаточные выводы в соответствии с принципом недостаточного основания. Чтобы получить необходимые основания для оценки или восстановления неизвестного входного
распределения на основе неполной, неточной информации, можно использовать различные процедуры, например, следует рассмотреть распределение вероятностей, которое имеет максимальную энтропию, допускаемую
имеющейся априорной информацией. При этом важно следовать такому
принципу: выбрать тип представления в соответствии с количеством имеющейся информации и оставаться верным имеющейся информации, включая
информационные пробелы. Применение принципа недостаточности (достаточности) оснований позволяет существенно расширить формы представления неопределенностей, такие, как P-boxes, Neumaier’s clouds, теория
Демпстера-Шафера, интервальные гистограммы, гистограммы второго порядка.
В рамках рассмотренных принципов распространения неопределенности можно достичь, используя метод вероятностных границ (Probability
bounds). Его основная идея приводится, например, в работе, и состоит
в следующем: «есть нечто, что можно сказать о неизвестном распределении. В частности, его функция распределения вероятностей или CDF
(Сumulative Distribution Function) должна лежать в области — ящике (box),
ограниченная нулем и единицей по вертикали и от минимума и максимума горизонтально. Истинная функция распределения, какой бы она ни
была, должна находиться в этой области». Идея построения вероятностных границ оказалась весьма продуктивной и нашла свое применение в
такой форме представления неопределенности, как P-box. Еще одним подходом к распространению неопределенности являются Облака Неймайера
(Neumaier’s clouds) , которые позволяют представить неполную стохастическую информацию четким, понятным и вычислительно привлекательным
способом, а также дают возможность визуализировать неопределенность
и обладают четкой семантикой, выступая посредником между понятием
нечеткого множества и вероятностным распределением. В рамках основных подходов к распространению неопределенности следует указать также на математическую теорию очевидностей (свидетельств) Демпстера–
Шафера (Dempster–Shafer theory), основанную на функции доверия (belief
functions) и функции правдоподобия (plausible reasoning), которые исполь
11

зуются, чтобы скомбинировать отдельные части информации (свидетельства) для вычисления вероятности события. Данная теория позволяет построить необходимые основания в условиях неопределенности путем оценки верхней и нижней границы интервала возможностей. Среди подходов
к распространению неопределенностей следует особенно выделить метод,
который опирается на понятие «вероятность второго порядка», и известен
как second-order probability. Данный подход представляет собой метод, позволяющий строить вероятностные оценки в случае эпистемической неопределенности.
Анализ отечественных и зарубежных публикаций показал, что такие понятия, как обработка неопределенностей (tradement), управление неопределенностями (management of uncertainties) и теория неопределенностей
(theory of uncertainty) становятся все более популярными направлениями
исследований. На это указывает присутствие данных направлений в международных конференциях, а также количество работ по данному направлению за последние несколько лет.
В этом контексте необходимо отметить книгу О.И. Ужга-Реброва «Управление неопреленностями» (2004) [97], которая посвящена современным концепциям и приложениям теории вероятностей. В качестве практических
приложений теории вероятностей рассматриваются вероятностные классификаторы и задачи принятия решений в условиях риска. Исследованию
математических методов обработки неопределенных данных посвящена монография А.В. Крянева и Г.В. Лукина (2006) [80].
Оптимизационные задачи представляют собой важную составляющую в
теории и практике принятия управленческого решения. Особое место среди
них занимают оптимизационные задачи с неопределенными входными данными. В случае, когда входные параметры содержат неопределенность, используется математический аппарат неопределенного программирования.
Исследованию неопределенностей и решению оптимизационных задач
принятия решений в условиях неопределенности посвящены работы китайского математика B. Liu , который в работе «Теория и практика неопределенного программирования» (2009) [21] рассматривает разнообразные задачи принятия оптимальных решений в условиях различных типов неопределенности.
Неопределенное программирование представляет собой теоретические
основы решения оптимизационных задач в условиях различных видов неопределенности. Подходы и методы неопределенного программирования имеют
ряд достоинств и определенные недостатки. Среди достоинств следует ука
12