Текстовые фрагменты публикации
Фрагмент текстового слоя документа размещен для индексирующих роботов.
Для полноценной работы с документом, пожалуйста, перейдите в
ридер.
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ЯДЕРНЫЙ УНИВЕРСИТЕТ «МИФИ»
В.А. Власов, А.О. Толоконский
МЕТОДЫ ОПТИМИЗАЦИИ
И ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
Рекомендовано УМО “Ядерные физика и технологии”
в качестве учебного пособия
для студентов высших учебных заведений
Москва 2013
УДК 681.51(075.8)
ББК 32.965я7
В58
Власов В.А., Толоконский А.О. Методы оптимизации и оптимального
управления. Учебное пособие. М.: НИЯУ МИФИ, 2013. – 88 с.
Предназначено для студентов групп А7-01-02-03 и студентов Экономико-
аналитического института НИЯУ МИФИ.
Содержит следующие основные разделы:
•
методы оптимизации функций многих переменных при наличии
ограничений;
•
применение вариационных методов для поиска оптимальных
управлений динамическими объектами;
•
применение принципа максимума Понтрягина для определения оптимального
управления;
•
дискретная и непрерывная формы метода динамического программирования;
•
методы линейного программирования.
В настоящее время практически отсутствуют литературные источники,
которые были бы изданы в последние годы и в которых достаточно
просто излагались бы комплексно перечисленные вопросы.
Подготовлено в рамках Программы создания и развития
НИЯУ МИФИ.
Рецензент проф. каф. «Информационные системы»,
д-р техн. наук Сальников Н.Л.
©
Национальный
исследовательский
ядерный университет «МИФИ», 2013
Редактор Е.К. Коцарева
Подписано в печать 15.11.2012. Формат 60x84 1/16
Печ. л. 5,5. Уч.-изд. л. 5,75. Тираж 120 экз.
Изд. № 57/1 Заказ № 11.
Национальный исследовательский ядерный университет «МИФИ».
Типография НИЯУ МИФИ,
ООО «Полиграфический комплекс «Курчатовский».
144000, Московская область, г. Электросталь, ул. Красная, д. 42.
ISBN 978-5-7262-1806-9
Оглавление
ВВЕДЕНИЕ ..................................................................................................................... 6
ГЛАВА 1. ОПТИМИЗАЦИЯ СТАТИЧЕСКИХ ОБЪЕКТОВ ..................................... 6
1.1. Понятие статических и динамических объектов .............................................. 6
1.2. Задача нелинейного программирования ........................................................... 7
1.3. Задачи на условный экстремум, неопределенные множители Лагранжа ...... 9
1.4. Пример применения метода неопределенных множителей Лагранжа для
поиска наибольших значений функций ................................................................. 14
1.5. Общая постановка задачи линейного оценивания параметров ..................... 16
Контрольные вопросы. ............................................................................................ 22
ГЛАВА 2. ОСНОВЫ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ .............................. 22
2.1. Постановка задачи ............................................................................................ 22
2.2. Основные геометрические фигуры в линейном программировании............ 23
2.3. Экстремальные точки ....................................................................................... 24
2.4. Основные теоремы об экстремальных точках ................................................ 27
2.5. Симплексный метод решения задач линейного программирования ............ 27
2.6. Учет ограничений типа неравенств ................................................................. 32
2.7. Поиск начальной экстремальной точки .......................................................... 33
Контрольные вопросы ............................................................................................. 34
ГЛАВА 3. СПОСОБЫ ОПИСАНИЯ ДИНАМИЧЕСКИХ СИСТЕМ ....................... 34
3.1. Передаточные функции .................................................................................... 34
3.2. Описание в форме Коши .................................................................................. 37
3.3. Управляемость, наблюдаемость, стабилизируемость, обнаруживаемось .... 38
3.4. Понятие фильтра и общая задача регулирования .......................................... 41
Контрольные вопросы ............................................................................................. 42
ГЛАВА 4. ПРИМЕНЕНИЕ ВАРИАЦИОННЫХ МЕТОДОВ ДЛЯ ПОИСКА
ОПТИМАЛЬНЫХ УПРАВЛЕНИЙ ............................................................................ 43
4.1. Понятие линейного пространства.................................................................... 43
4.2. Функционал и его вариация ............................................................................. 45
4.3. Вычисление вариации функционала ............................................................... 46
4.4. Задача Эйлера .................................................................................................... 46
4.5. Применение уравнения Эйлера для поиска оптимального закона
управления................................................................................................................ 48
4.6. Уравнение Эйлера – Пуассона и его применение .......................................... 49
4.7. Функционалы, зависящие от векторного аргумента ...................................... 50
4.8. Неопределенные множители Лагранжа в вариационном исчислении ......... 51
Контрольные вопросы ............................................................................................. 52
ГЛАВА 5. ВАРИАЦИОННЫЕ ЗАДАЧИ С ПОДВИЖНЫМИ ГРАНИЦАМИ ....... 53
5.1.Основные виды задач с подвижными границами ........................................... 53
5.2. Скольжение граничных точек по заданным траекториям ............................. 53
Контрольные вопросы ............................................................................................. 55
ГЛАВА 6. ПРИНЦИП МАКСИМУМА И ДИНАМИЧЕСКОЕ
ПРОГРАММИРОВАНИЕ ............................................................................................ 56
6.1. Постановка задачи поиска оптимального управления ................................... 56
6.2. Пояснения к получению принципа максимума .............................................. 57
6.3. Динамическое программирование ................................................................... 58
6.4. Примеры применения динамического программирования ........................... 59
Контрольные вопросы ............................................................................................. 63
ГЛАВА 7. АНАЛИТИЧЕСКОЕ КОНСТРУИРОВАНИЕ РЕГУЛЯТОРОВ (АКОР) .. 63
7.1. Постановка задачи ............................................................................................ 63
7.2. Решение задачи АКОР ...................................................................................... 64
7.3. Уравнение Риккати ........................................................................................... 68
7.4. Общие свойства решения уравнения Риккати ................................................ 70
7.5. Способы решения уравнения Риккати ............................................................ 71
7.6. Пример решения задачи АКОР ........................................................................ 72
7.7. Метод диагонализации ..................................................................................... 75
Контрольные вопросы ............................................................................................. 77
ГЛАВА 8. СЛУЧАЙНЫЕ ПРОЦЕССЫ В СИСТЕМАХ УПРАВЛЕНИЯ ............... 77
8.1. Описание случайных процессов ...................................................................... 77
8.2. Стохастические дифференциальные уравнения ............................................. 80
8.3. Прогнозирование (оценивание) значений случайных величин с
использованием закона распределения .................................................................. 81
8.4. Линейное оценивание значений случайных величин .................................... 82
Контрольные вопросы ............................................................................................. 83
ГЛАВА 9. ФИЛЬТР КАЛМАНА ................................................................................. 84
9.1. Постановка задачи ............................................................................................ 84
9.2. Основные принципы получения формул дискретного фильтра Калмана .... 84
9.3. Получение формул фильтра Калмана ............................................................. 85
Контрольные вопросы ............................................................................................. 87
СПИСОК ЛИТЕРАТУРЫ ............................................................................................ 88
ВВЕДЕНИЕ
Методы оптимизации широко используются в различных прикладных
разделах теории управления. Это и выбор оптимальных
управляющих воздействий, и построение разнообразных фильтров,
и учет случайных возмущений на системы и т.д.
Однако, не смотря на многочисленные опубликованные монографии,
в которых подробно рассматриваются определенные разделы
теории управления, отсутствуют литературные источники, в
которых были бы компактно собраны основные теоретические методы,
применяемые для решения такого широкого круга вопросов.
Кроме того, многие монографии изданы достаточно давно и либо
отсутствуют, либо имеются в незначительных количествах в библиотечных
фондах. Данное учебное пособие направлено на устранение
этих недостатков.
ГЛАВА 1. ОПТИМИЗАЦИЯ СТАТИЧЕСКИХ ОБЪЕКТОВ
1.1. Понятие статических и динамических объектов
Объект, поведение которого описывается дифференциальными
уравнениями, будем называть динамическим. Такие объекты обычно
рассматриваются в теории автоматического управления. Примерами
таких объектов могут служить электрические цепи, содержащие
конденсаторы и индуктивности (например, колебательные
контуры, двигатели, R-C цепи и т.д.). Полнота описания таких объектов
зависит от конкретных постановок задач регулирования и
управления.
Наряду с динамическими объектами имеются статические объекты.
Простейшим таким объектом является делитель сопротивлений.
Очень часто динамические объекты с целью упрощения решения
задач относят к объектам статическим. Например, электронный
усилитель, который входит в состав системы автоматического
управления достаточно инерционными устройствами, может с достаточной
степенью точности описываться коэффициентом усиления.
Однако, если объект управления мало инерционен, то в том же
усилителе приходится учитывать его динамические характеристики
(время нарастания фронта выходного импульса; паразитные связи,
возникающие из-за малых паразитных емкостей и т.д.).
Статические объекты в общем случае описываются системами
нелинейных уравнений (в простейших ситуациях – системами линейных
уравнений), но эти уравнения не являются дифференциальными.
Динамические объекты, вообще говоря, описываются дифференциальными
уравнениями. Но наиболее ощутимые практические
результаты связаны, в основном, с использованием линейных дифференциальных
уравнений.
1.2. Задача нелинейного программирования
Основные понятия нелинейного программирования можно найти
в [1].
Пусть x – элемент множества X и
( )
f x – функция, заданная
на множестве и принимающая вещественные значения. Задача состоит
в том, чтобы среди элементов множества X , удовлетворяющих
ограничениям:
( )
0,
( )
0,(
1,2,..., ;
1,2,..., )
i
i
g x
h x
i
n j
k
≤
=
=
=
,
(1.2.1)
найти такое x-
, чтобы для всех элементов x , удовлетворяющих условиям (
1.1), значение
( )
f x-
было наименьшим, т.е. выполнялось
соотношение
( )
( )
f x
f x
≥
-
. Элемент x , удовлетворяющий ограничениям (
1.2.1), называется допустимым решением задачи математического
программирования. Допустимое решение x-
называется
оптимальным.
Здесь
( )
ig x и
( )
ih x – функции, определенные на множестве X
и также принимающие вещественные значения.
Ограничения (1.2.1) обычно записываются либо в виде неравенств,
либо в виде равенств.
Элементы x множества X могут иметь самый разнообразный
физический смысл.
Примеры
Пример 1.1. Рассмотрим школьную задачу (предлагается часто
на вступительных экзаменах в вуз). Среди всех прямоугольников
заданной площади
0
S найти такой прямоугольник, у которого периметр
2(
)
P
a
b
=
+
имеет наименьшее значение, где ,a b – длины
сторон прямоугольника.
X – множество всех прямоугольников, x – выбранный прямоугольник.
Ограничений в виде неравенств нет. Имеется ограничение
в виде равенства
0
( )
0
S x
S
−
=
. Длины сторон ,a b прямоугольника
однозначно связаны с выбранным прямоугольником x . Поэтому
задачу можно сформулировать так. Имеется функция
( , )
2(
)
P
f a b
a
b
=
=
+
двух переменных
,a b (это составляющие
элементов x ). На переменные наложено ограничение
0
0
ab
S
−
=
.
Найти такие a-
и b-
, чтобы значение
( , )
f a b-
-
в условиях действия
ограничения было наименьшим.
Пример 1.2 (заимствован из [1]). Найти наименьшее значение
функции
2
2
1
2
1
2
( ,
)
(
3)
(
2)
f x x
x
x
=
−
+
−
при
условиях
2
1
2
2
1
3
0,
1
0,
0
x
x
x
x
−
− ≤
− ≤
−
≤
.
Решение. Здесь X – множество точек плоскости, а также имеется
три ограничения в виде неравенств:
1
1
2
2
1
2
3
1
2
( ,
)
0,
( ,
)
0,
(
,
)
0,
g x x
g
x x
g
x x
≤
⎧
⎪
≤
⎨
⎪
≤
⎩
где
2
1
1
2
1
2
2
1
2
2
3
1
2
1
( ,
)
3,
( ,
)
1,
( ,
)
.
g x x
x
x
g
x x
x
g
x x
x
⎧
=
−
−
⎪
=
−
⎨
⎪
= −
⎩
Ограничений в виде равенств нет. Решается эта задача просто из
геометрических соображений с применением понятия линий уровня [
1]. Линией уровня называется множество точек, удовлетво-
ряющих условию,
1
2
( ,
)
f x x
C
=
, где C – константа. В многомерном
случае рассматривается обобщение этого понятия – поверхность
уровня, описание которой имеет вид
1
2
( ,
,...
)
n
f x x
x
C
=
.
Простое решение задачи нелинейного программирования встречается
редко. Поэтому рассматриваются типовые классы задач, для
которых разработаны эффективные методы решения. В остальных
ситуациях приходится применять численные методы поиска оптимальных
решений.
Замечания:
•
всякое ограничение, записанное в виде неравенства
( )
0
ig x ≥
, может быть сведено к эквивалентному ограничению
( )
0
ig x ≤
-
, где
( )
( )
i
i
g x
g x
= −
-
;
•
задача поиска наибольшего значения функции
( )
f x эквивалентна
задаче поиска наименьшего значения функции
( )
f x
-
, где
( )
( )
f x
f x
= −
-
-
.
1.3. Задачи на условный экстремум, неопределенные
множители Лагранжа
Метод множителей Лагранжа обычно применяется при решении
задач отыскания экстремума соответствующего критерия оптимальности,
когда на независимые переменные наложены ограничения
в виде равенств. Пусть требуется найти экстремум функции
1
2
( ,
,...
)
n
f x x
x
,
(1.3.1)
зависящей от n переменных (i=1,2,..., n). Значения переменных
ix в
свою очередь связанны соотношениями
1
2
φ ( ,
,...
)
0,
1,2,...,
k
n
x x
x
k
m
=
=
.
(1.3.2)
Экстремум, который достигается функцией (1.3.1) с учетом выполнения
соотношений (1.3.2), называется условным или связанным.
Число m соотношений (1.3.2) в изложенной постановке задачи
должно быть меньше числа независимых переменных n. Если допустить
равенство m
n
=
, то в этом случае можно попытаться ре-
шить систему уравнений (1.3.2), поскольку число уравнений равно
числу неизвестных. Полученное решение, если оно существует,
определит дискретное множество точек (если эта система не имеет
решения, то ограничения (1.3.2) определяют пустое множество).
Поэтому решение задачи сведется к перебору допустимых точек
(решений), удовлетворяющих соотношениям (1.3.2).
Если m
n
<
, то в общем случае для решения задачи с такими ограничениями
используется метод неопределенных множителей Ла-
гранжа, сводящий задачу с ограничениями вида равенств к обычной
экстремальной задаче без ограничений. Это делается следующим
способом:
•
составляется вспомогательная функция n
m
+
равноправных
переменных
,λ ,(
1,2,..., ,
,2,...,
)
i
j
x
i
n j
m
=
=
1
2
1
2
1
2
1
1
1
2
1
2
Ф(
,
,...,
,λ ,λ ,...,λ )
(
,
,...
)
λ φ ( ,
,...
)
...
λ φ ( ,
,...
),
n
m
n
n
m
m
n
x x
x
f x x
x
x x
x
x x
x
=
+
+
+
+
(здесь
1λ ,...,λk – дополнительные переменные, называемые
неопределенными множителями Лагранжа);
•
находится точка M с координатами
1
1
,...
,λ ,...,λ
n
k
x
x
-
-
-
-
(или
точки, если их много) безусловного экстремума функции
Ф;
•
по найденной точке M определяется точка M-
, имеющая
координаты
1,... n
x
x
-
-
(найденные значения
1λ ,...,λk
-
-
введенных переменных далее не рассматриваются); точка
M-
является точкой условного экстремума функции
f , если такой экстремум существует.
Решим Пример 1.1 из раздела 1.2, применяя метод неопределенных
множителей Лагранжа.
Функция Ф в этом примере имеет вид
0
Ф
2(
)
λ(
)
a
b
ab
S
=
+
+
−
.
Приравнивая частные производные от функции Ф по аргументам
, ,λ
a b
нулю, получим систему уравнений
0
2
λ
0,
2
λ
0,
.
b
a
ab
S
+
=
⎧
⎪ +
=
⎨
⎪
=
⎩
Последняя система уравнений решается с помощью исключения
переменных:
2
λ
a = −
и
2
λ
b = −
. После чего получается одно уравнение
0
2
4
λ
S
=
. Окончательно решение системы можно записать в
виде
0
2
λ
S
= −
и
0
a
S
=
,
0
b
S
=
(значение λ не может быть положительным,
так как это приведет к отрицательным длинам ,a b ;
в математической постановке задачи программирования для корректности
сразу следовало ввести ограничения:
0
a >
,
0
b >
. Значение
величины λ нас не интересует.
Понятно, что рассмотренный пример можно решить значительно
проще. Учитывая ограничение
0
0
ab
S
−
=
, исключим одну из
переменных
0
S
b
a
=
. Тогда решение задачи сведется к оптимизации
функции одного аргумента
0
2(
)
S
P
a
a
=
+
. Приравнивая нулю производную
dP
da , получим оптимальное решение
0
a
S
=
. Поэтому,
казалось бы, можно предложить следующий алгоритм решения задачи
на условный экстремум:
•
из системы уравнений (1.3.2) можно выразить m переменных
ix
как функции остальных m
n
−
переменных, представить
ограничения (1.3.2) в виде
)
,...,
(
ψ
1
n
m
k
k
x
x
x
+
=
,
m
k
,...,
2,1
=
;
•
подставить только что полученные соотношения в выражение (
1.3.1) и получить новую функцию, которая будет зависеть
уже только от n
m
−
переменных, не связанных дополнительными
условиями;
•
найти безусловный экстремум новой функции.
Однако часто бывает трудно или вообще невозможно аналитически
решить систему уравнений (1.3.2) относительно некоторых
переменных. Поэтому для отыскания экстремума функции многих
переменных (1.3.1) с ограничениями (1.3.2) на независимые переменные
в виде равенств используют метод неопределенных множителей
Лагранжа.
Метод неопределенных множителей Лагранжа получается из
следующих рассуждений.
Общим необходимым условием экстремума является равенство
нулю дифференциала функции
1
1
...
0
n
n
f
f
df
dx
dx
x
x
∂
∂
=
+
+
=
∂
∂
.
(1.3.3)
Не имеет значения, наложены ли ограничения на дифференциалы
аргументов.
Однако если ограничения наложены, то неправильно было бы
приравнивать все частные производные нулю, поскольку дифференциалы
переменных
(
1,2,..., )
i
dx i
n
=
в выражении (1.3.3) не все
являются независимыми.
Предположим, что в некоторой точке
0x с координатами
10
20
0
,
,...,
n
x
x
x
функция f имеет экстремум. При этом условия
(1.3.2) в данной точке выполняются.
Продифференцировав условия (1.3.2), получим систему равенств,
связывающих дифференциалы
i
dx в любой точке, в том
числе и в точке
0x :
1
φ
0,
1,2,...,
n
k
i
i
i
dx
k
m
x
=
∂
=
=
∂
∑
.
(1.3.4)
Понятно, что можно выделить (
)
n
m
−
свободных дифференциалов,
например
1,...,
m
n
dx
dx
+
, а остальные дифференциалы
1,...,
m
dx
dx в каждой точке являются линейными функциями свободных
дифференциалов.
Умножим каждое из равенств системы (1.3.4) на пока неопределенный
персональный множитель λk и сложим все эти равенства с
выражением (1.3.3).
Тогда, объединяя слагаемые с одинаковыми дифференциалами
i
dx , найдем
1
1
1
φ
φ
(
λ
...
λ
)
0
n
m
m
i
i
i
i
i
f
dx
x
x
x
=
∂
∂
∂
+
+
+
=
∂
∂
∂
∑
.
(1.3.5)
Равенство (1.3.5) должно быть справедливо в точке условного
экстремума.
В соотношении (1.3.5) произвольно можно изменять лишь независимые
дифференциалы. Для того чтобы исключить m зависимых
дифференциалов выберем m множителей
1λ ,...,λk так, чтобы коэффициенты
при этих дифференциалах обратились в нуль в точке условного
экстремума, т.е. обеспечим равенства
1
1
φ
φ
λ
...
λ
0,
1,2,...,
m
m
i
i
i
f
i
m
x
x
x
∂
∂
∂
+
+
+
=
=
∂
∂
∂
.
(1.3.6)
Тогда в соотношениях (1.3.5) останется только ( –
)
n
m слагаемых
с независимыми дифференциалами. Поскольку получена линейная
форма из независимых дифференциалов, равная нулю при
любых их значениях, то коэффициенты этой формы должны быть
равными нулю. Это означает, должны выполняться равенства
(1.3.6) для остальных значений индекса i :
1
1
φ
φ
λ
...
λ
0,
1,...,
m
m
i
i
i
f
i
m
n
x
x
x
∂
∂
∂
+
+
+
=
=
+
∂
∂
∂
.
(1.3.7)
Понятно также, что координаты точки, где достигается условный
экстремум, удовлетворяют ограничениям (1.3.2). Таким образом,
совокупность уравнений (1.3.2), (1.3.6), (1.3.7) позволяет найти
(
)
n
m
+
значений переменных
1
2
1
2
,
,...,
, λ ,λ ,...,λ
n
m
x x
x
, при которых
достигается условный экстремум функции (1.3.1), причем значения
неопределенных множителей нас уже не интересуют.
Легко проверить, что совокупность уравнений (1.3.2), (1.3.6),
(1.3.7) может быть получена с помощью приравнивания нулю частных
производных от функции
1
2
1
2
1
2
1
1
1
2
1
2
Ф(
,
,...,
,λ ,λ ,...,λ )
(
,
,...,
)
λ φ ( ,
,...,
)
...
λ φ (
,
,...,
).
n
m
n
n
m
m
n
x x
x
f x x
x
x x
x
x x
x
=
+
+
+
+
Значение метода множителей Лагранжа состоит и в том, что он
применяется в качестве вспомогательного средства оптимизации в
аналитических задачах. Например, он успешно используется при