Синтез оптимальных регуляторов в автоматических системах при случайных возмущениях
В гл. I излагаются способы математической формализации различных стохастических задач оптимального управления, основанные на использовании метода динамического программирования. Формулируются задачи синтеза оптимальных автоматических систем, различающихся целями управления и степенью информированности о текущем состоянии объекта управления. В случае полной информации о состоянии получены… Читать ещё >
Содержание
- ГЛАВА I. ЗАДАЧИ СИНТЕЗА СТОХАСТИЧЕСКИХ СИСТЕМ И МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
- I. Постановки задач синтеза оптимальных автоматических систем
- 2. Формальная схема метода динамического программирования
- 3. Использование достаточных координат при записи уравнений Беллмана
- ГЛАВА 2. ТОЧНЫЕ МЕТОДЫ СИНТЕЗА
- 4. Системы с линейными объектами управления, квадратичным критерием оптимальности и неограниченными управлениями
- 5. Синтез следящих систем с ограниченной скоростью исполнительного двигателя
- ГЛАВА 3. СИНТЕЗ КВАЗИОПТИМАЛЬНЫХ СИСТЕМ В СЛУЧАЕ МАЛЫХ ДИФФУЗИОННЫХ ЧЛЕНОВ УРАВНЕНИЯ БЕЛЛМАНА
- 6. Расчёт квазиоптимальной системы слежения за дискретным марковским процессом
- ГЛАВА 4. ПРИБЛИЖЁННЫЙ СИНТЕЗ СТОХАСТИЧЕСКИХ СИСТЕМ УПРАВЛЕНИЯ ПРИ МАЛОЙ ВЕЛИЧИНЕ УПРАВЛЯЮЩИХ ВОЗДЕЙСТВИЙ
- 7. Приближённое решение задач синтеза для стационарного режима работы автоматической системы
- 8. Расчёт квазиоптимального регулятора для колебательного объекта управления
- 9. Синтез квазиоптимальных управлений в случае коррелированных помех
- 10. Нестационарные задачи. Оценки качества приближённого синтеза
- II. Исследование асимптотической сходимости метода последовательных приближений (У1) — (УШ) при
- 12. Синтез стохастических систем с распределёнными параметрами. Управление концентрацией в трубопроводе конечной длины
- ГЛАВА 5. УПРАВЛЕНИЕ СТОХАСТИЧЕСКИМИ КОЛЕБАТЕЛЬНЫМИ СИСТЕМАМИ КВАЗИГАРМОНИЧЕСКОГО ТИПА
- 13. Оптимальная стабилизация колебаний в системах со случайными возмущениями типа белого шума
- 14. Оптимальное управление квазигармоническими системами при наличии шума в канале обратной связи
- ГЛАВА 6. НЕКОТОРЫЕ СПЕЦИАЛЬНЫЕ ТЕХНИЧЕСКИЕ ЗАДАЧИ СИНТЕЗА
- 15. Управление динамическими объектами, содержащими неизвестные параметры
- 16. Некоторые стохастические задачи управления с ограничениями на фазовые координаты
- 17. Программа численного синтеза и результаты счёта на ЭВМ
- 18. Расчёт квазиоптимальной системы управления проветриванием выемочных участков угольных шахт
- 19. Система стабилизации скорости резания токарных станков
- РИСУНКИ, ГРАФИКИ, ВСПОМОГАТЕЛЬНЫЕ ФОРМУЛЫ
Синтез оптимальных регуляторов в автоматических системах при случайных возмущениях (реферат, курсовая, диплом, контрольная)
Одной из основных теоретических и практических задач современной кибернетики и автоматики является разработка различных оптимальных систем управления. Такие системы обладают наилучшими (в известном смысле) свойствами по сравнению с любыми другими системами из некоторого определенного класса. Задачи такого рода при всем их разнообразии могут быть разделены на две основные категории: детерминированные и стохастические. В задачах первого типа поведение системы полностью определяется структурой автоматического устройства, и для любого начального состояния управляемого объекта его дальнейшее движение может быть представлено в виде известной функции времени. В стохастических задачах такая возможность отсутствует, поскольку в этом случае поведение системы носит случайный характер.
Следует отметить, что случайный характер движения управляемой системы может быть обусловлен самим существом задачи (например, в задаче о слежении за некоторым случайным процессом). Другим источником неполноты информации о поведении системы являются различные дестабилизирующие факторы (помехи), которые всегда имеют место в реальных физических устройствах. Это связано обычно с наличием «шумов» в радиоэлектронных блоках, погрешностей измерения, неодно-родностей среды протекания процесса. Случайные возмущения могут быть вызваны нестабильностью источников питания электрических схем, порывами ветра и неоднородностями плотности воздуха (при управлении летательными аппаратами), разбросом характеристик и конструктивных параметров элементов системы, ошибками исполнения программы управления и другими причинами. В качестве примеров технических систем, в которых применение методов стохастического оптимального управления может оказаться весьма эффективным, можно указать на различные системы стабилизации курса (самолета, корабля), дистанционные системы воспроизведения угла, системы управления антенной радиолокатора, системы стабилизации скорости резания токарных станков, системы стабилизации или обеспечения закона изменения температуры в различных частях химического реактора, организацию профилактического ремонта сложной системы и т. д. Учет случайных воздействий может привести также к появлению задач, не имеющих аналогов в детерминированной теории оптимального управления (например, задачи, связанные с максимизацией времени достижения границ). Все это свидетельствует о большом разнообразии и практической важности задач оптимального автоматического управления при случайных возмущениях. Задачи такого рода составляют предмет исследования в данной диссертации .
В общих чертах проблема построения оптимальной системы состоит в следующем. Всякая система автоматического управления состоит из двух основных частей (блоков, подсистем): объекта управления O и управляющего блока (регулятора) (рис. I). Объект управления представляет собой некоторую динамическую систему (механическую, электрическую и т. п.), поведение которой описывается известным оператором связи между входными (управляющими) воздействиями li (t) и выходными параметрами X (t), характеризующими состояние объекта управления в момент времени t • В диссертации в основном исследуются системы, у которых оператор блока 0 задается системой обыкновенных дифференциальных уравнений (в этом случае текущие значения управляющих и выходных параметров Ы> и X — конечномерные векторы Ц, = t) = (U4 (t), U-Jt), .. , M/T,(t)), «X = (x (t) (ЭС1№>••-> Только в § 12 главы 4 рассматриваются объекты управления, описываемые уравнениями с частными производными.
При любом способе описания оператор блока 0 считается заранее заданным и фиксированным. Что касается управляющего блока, то никаких предварительных условий на его структуру не накладывается, и его необходимо построить таким образом, чтобы обеспечивалось минимальное значение некоторого заданного функционала (критерия оптимальности) I ^(t), от траекторий J X (t) — 0? Ъ zT^j } Нахождение структуры управляющего блока J является главной задачей теории оптимального управления. Вопросы, связанные с разработкой методов расчета оптимальных управляющих устройств (регуляторов) У, занимают центральное место в данной диссертации.
Если случайные воздействия на систему отсутствуют, то сформулированная проблема сводится к нахождению оптимальной программы 0 $ tТ ^, обеспечивающей движение объекта управления по экстремальной траектории O^t^Tl. Для расчета оптимальной программы U (t) можно использовать либо методы классического вариационного исчисления|з8, 118,201 ] * либо, в более общей ситуации, принцип максимума Л. С. Понтрягина [ 146, либо основанные на них различные варианты приближенных методов.
Оптимальная автоматическая система, проектируемая без учета случайных факторов, может быть разомкнутой, как на рис. I. Это является следствием однозначной определенности (детерминизма) траектории управляемого объекта ^ X (t) — 0 $ t $ Т, а, следовательно, и критерия оптимальности I [x (t), w, (t)^ при фиксированной программе изменения управляющих воздействий | U-(t): 0 $ t ~ ^ ^ предполагается, конечно, что при заданном начальном состоянии Х (0) = Хо и заданной входной функции И (Ь) уравнения движения объекта 0 имеют единственное решение).
Иначе обстоит дело, когда на систему действуют неконтролируемые случайные возмущения. Для эффективного управления в этом случае необходимо использовать информацию о фактическом текущем состоянии объекта, т. е. оптимальная система обязательно должна быть замкнутой, работающей по принципу обратной связи. По такому принципу, в частности, строятся все следящие автоматические системы (рис. 2). При проектировании таких систем кроме оператора объекта О необходимо учитывать также свойства некоторого источника информации, задающего в каждый момент времени требуемое значение ^(«Ь) вектора выходных параметров х[ь) (разнообразные примеры конкретных следящих систем можно найти, например, в15, 31, 77, 105, 149 — 151, 185 ^). Измеряя текущие значения входных Ч («1) и выходных 0С (1) величин, блок У в каждый момент.
Г Ь Ь 1 времени t формирует управляющие воздействия ^) —, ЗС0 ] (и X* - наблюденные к моменту t траектории.
3 t ^ ^ХС^У- 0 ^ ^ ~ ^) таким образом, чтобы по возможности выполнялось равенство ^ (¦?) =Х («Ь) при 0 ^ ЬТ. Однако случайный характер задающего воздействия ^ (?) с одной стороны и инерционность объекта управления 0 с другой не позволяют обеспечить требуемое равенство входных и выходных параметров. Поэтому естественным образом возникает задача об оптимальном управлении.
Для этого, как и в детерминированном случае, вводится критерий оптимальности 1 ^ ^ («Ь4), являющийся мерой «расстояния» между вектор-функциями и на отрезке времени.
Окончательная формулировка задачи зависит от характера предположений о свойствах задающего воздействия ^(t). В диссертации используется вероятностное описание всех случайных возмущений, действующих на систему. Это означает, что все возмущения рассматриваются как случайные функции с известными статистическими характеристиками. При таком подходе оптимальный закон управления, определяющий конструкцию блока U, находится из условия минимума среднего значения критерия i [?jl^"3^^!. Другой подход, когда вместо вероятностных характеристик задаются лишь области возможных значений возмущений и для построения оптимальной системы используются методы теории игр, описан в монографиях Красовского H.H. J^I07 Красовского H.H., Субботина А. И. 108 Куржанского А. Б. 115 ] .
Если на работу следящей системы рис. 2 существенное влияние оказывают шумы, связанные с погрешностями измерения, нестабильностью источников питания электрических схем, непостоянством свойств среды функционирования автоматической системы, то блок-схема рис. 2 усложняется и может принять вид, изображенный на рис. 3. На схеме рис. 3 через C (t), , ^(t) обозначены случайные возмущения, искажающие информацию о задающем воздействии и состоянии объекта управления x (t), а также изменяющие вектор управляющих величин. Цифрами I, 2, 3 обозначены блоки, характеризующие способ комбинации полезных сигналов и помех. Их структура обычно предполагается известной. Автоматические системы управления с более сложными, чем на рис. 3, функциональными схемами в диссертации не рассматриваются.
Теория оптимального управления динамическими системами начала развиваться сравнительно недавно. За начало отсчета в развитии этой теории часто принимают пятидесятые годы, когда был установлен принцип максимума Л. С. Понтрягина (результаты соответствующих исследований Л. С. Понтрягина и его школы были изложены в книге Л.С.Лонтряги-на, В. Г. Болтянского, Р. В. Гамкрелидзе, Е. Ф. Мищенко [ 146 ]) и сформу лирован принцип динамического программирования Р. Беллмана[ 10 ]. И хотя к этому времени уже был опубликован ряд работ по оптимальному управлению (работы Д. Е. Охоцимского [ 137^, А. А. Фельдбаума? 1831 Ж. П. Ласалля? 217и других), только в конце пятидесятых годов, как было отмечено в монографии Н. Н. Моисеева [ 130 j, «произошла та канонизация методов и языка, которая свидетельствовала о появлении новой дисциплины» — теории оптимального управления.
Дальнейшее развитие теории было связано с разработкой различных вычислительных методов оптимального управления. В детерминированной теории интенсивно разрабатывались численные методы решения краевых задач принципа максимума. Изложение различных вариантов этих методов приведено в монографиях Г. Л. Гродзовского, Ю. Н. Иванова, В. В. Токарева [ 45, Н. Н. Моисеева [ 130 J, Брайсона, Хо Ю-ши [23 3 и др. Алгоритмы численного решения, основанные на использовании градиентных методов в пространстве управлений были предложены в работах Л. И. Шатрове ко го 198 J, Т. М. Энеева 203, Брайсона, Денхэма ^ 209 ^ и др. Обобщения и различные модификации градиентных методов содержатся в работах В. Ф. Демьянова, А. М. Рубинова ^ 52 Н. Н. Моисеева ^ 128J и др. Другой способ решения задач оптимального управления, базирующийся на принципе максимума и использующий процедуру последовательных приближений, был предложен в работах: И. А. Крылов, Ф.Л.Черноусько^ 112 j, Келли, Копп, Мойер [ 215 J. Ряд работ посвящен изложению группы численных методов, связанных с варьированием и перебором траекторий в пространстве фазовых координат. Сюда относятся метод последовательного анализа вариантов В. С. Михалевича и Н.З.Щора[ 127 метод перебора траекторий Н. Н. Моисеева [ 128 ], метод локальных вариаций ФД. Черноусь-ко ?194,195]. Обширная литература посвящена разработке и исследованию численных методов для линейных управляемых систем. Сюда относятся работы В. Ф. Демьянова [ 50 ], В. И. Зубова 61 ], Н. Е. Кирина [ 71, А. А. Красовского [ 105 ]. А. М. Летова jj23 ], Б.H.Пшеничного [ 154 ] и др. Для решения задач оптимального управления линейными системами были разработаны специальные методы, использующие идеи функционального анализа. Так, в монографии Н.Н.Красовс-кого 107 ] изложен способ решения, основанный на классической проблеме моментов. К этому же направлению относятся работы Р. Габа-сова, Ф. М. Кирилловой [ 33 j, Е. С. Левитина, Б. Т. Поляка ^ 122 ] и др. Применению методов функционального анализа в задачах управления нелинейными системами посвящена книга К. А. Пупкова, В. И. Капалина, А. С. Ющенко 152 «J. Некоторые вычислительные алгоритмы, основанные на проблеме моментов, были предложены А. Г. Бутковским [ 26,27] для решения задач оптимального управления системами с распределенными параметрами. Обзор исследований по оптимальному управлению распределенными системами содержится в работе А. Г. Бутковского,.
A.И.Егорова, К. А. Лурье 210 ]. Весьма распространенным способом численного решения задач оптимального управления является использование методов дискретизации непрерывных моделей процессов с последующим применением к полученным конечномерным задачам методов нелинейного программирования. Изложение различных методов минимизации функций многих переменных имеется в книгах Б. Н. Пшеничного, Ю. М. Данилина | 155 ], Ю. И. Дегтярева? 48 J и др.
Наряду с численными методами решения детерминированных задач оптимального управления широкое распространение получили различные приближенные аналитические методы. Так, в работах В. И. Зубова ^ 61 ] ,.
B.Б.Колмановского? 75 J и др. были предложены способы расчета управлений для квазилинейных объектов. Ряд работ посвящен применению метода осреднения для приближенного решения задач управления колебательными системами. Относящиеся сюда результаты изложены в57, 129, 130, 133, 197 ] • Приближенный метод расчета алгоритмов управления для слабо управляемых систем описан в работах 45, 76, 192, 196 3 .
Одновременно с теорией детермированных систем развивалась стохастическая теория оптимального управления. Следует, однако, отметить, что указанные две ветви теории оптимального управления хотя и развивались параллельно во времени, тем не менее их развитие шло разными путями. Причина этого различия связана со специфическими особенностями детерминированных и стохастических задач. Так, в стохастическом случае использование принципа максимума Л. С. Понтрягина, основанного на рассмотрении индивидуальных траекторий управляемого процесса, вызывает определенные технические трудности в нахождении структуры блока управления ^ в системах, работающих по принципу обратной связи (рис. 2, 3). Поэтому в качестве основы для решения стохастических задач оптимального управления в настоящее время чаще всего используются идеи и принципы динамического программирования, позволяющие свести задачу синтеза оптимальной системы к решению некоторого нелинейного дифференциального или функционального уравнения (уравнения Беллмана).
В стохастической теории оптимального управления широко используются результаты, полученные в теории вероятностей и в теории случайных функций. Применению теории случайных функций к системам автоматического регулирования посвящены монографии В. С. Пугачева [ 149], И. Е. Казакова [ 65 ], А. А. Первозванского [^140 |, К. А. Пупкова [153 ] и др.
Одними из первых работ, в которых для решения стохастических задач оптимального управления использовались идеи динамического программирования, были работы А. А. Фельдбаума 184 J по теории дуального управления и Н. Н. Красовского, Э. А. Лидского [ 109, НО ] по аналитическому конструированию регуляторов. В работах |^I09,II0 J была установлена связь между проблемой оптимального управления и вопросами устойчивости и стабилизации движения при случайных возмущениях, изучавшимися в книгах А. А. Красовского? 105 j, Б. В. Ларина, К. И. Науменко, В. Н. Сунцева J, Р. З. Хасьминского? 190 ] и др. Многочисленные исследования посвящены решению линейно-квадратичных задач оптимального управления при случайных возмущениях. В этом случае оптимальный регулятор представляет собой линейный усилитель с перестраиваемыми коэффициентами усиления, изменение которых во времени устанавливается на основе решения обыкновенного матричного дифференциального уравнения типа Риккати. Изложение относящихся сюда вопросов приведено в книгах М. Аоки f 6 ], В. Н. Афанасьева [7J, Д. Брайсона, Хо Ю-иш [^23, Л. Г. Евланова, В. М. Константинова [ 56 ], В. И. Зубова 61 ], Г. Кушнера [ 117, Р. Ш. Липцера, А. Н. Ширяева [ 125 ], К. Ю. Острема [ 136 ], Я.Н.Ройтен-берга [ 159 ] и др.
Способы построения оптимальных систем управления на основе теории оптимальной линейной и нелинейной фильтрации (базирующиеся, в частности, на теории фильтра Винера) изложены в монографиях B.C. Пугачева, И. Е. Казакова, Л. Г. Евланова ^ 151 ], Н. И. Андреева [4 J и др., в работах М. Г. Зотова59, 60j, В. В. Солодовникова и ДР.
Широкий круг задач оптимального управления, фильтрации и теории информации был решен на базе разработанной Р. Л. Стратоновичем теории условных марковских процессов. Результаты данного направления нашли отражение в книгах Р. Л. Стратоновича? 175 ], Б. Н. Петрова, Г. М. Уланова, С. В. Ульянова, Э. М. Хазен [ 142 ], Ю. Г. Сосулина [ 168, В. И. Тихонова, Н. К. Кульмана [ 179 «J и др.
Математические вопросы, связанные с обоснованием возможности использования динамического программирования для решения стохастических задач синтеза, установлением теорем существования и единственности решений уравнения Беллмана, исследованием асимптотических свойств функции потерь, были предметом изучения в монографиях И. И. Гихмана, А. В. Скорохода [ 41 J, Н. В. Крылова [ 113], Р.Л.Стратоно-вича [ 175, У. Флеминга, Р. Ришела [ 186 ], Р. З. Хасьминского [l90j и др. Некоторые математические вопросы стохастических проблем синтеза оптимальных управлений обсуждаются в книгах Р. Габасова, Ф. М. Кирилловой [ 34 ], В. Я. Катковника [ 70 J, В. Ф. Кротова, В. И. Гурмана? III ] .
В тех случаях, когда измерение текущего состояния стохастического объекта управления сопровождается случайными погрешностями, а сам процесс измерения связан с определенными «затратами» или «потерями», возникают задачи об оптимизации процессов наблюдения, а также об оптимальном сочетании процессов наблюдения и управления. Различные постановки задач такого рода и результаты исследований в этом направлении приведены в книгах Р. Л. Стратоновича? 175, Ф. Л. Черноусько, В. Б. Колмановского [ 196 ], П. Е. Эльясберга 202 j и других работах.
В некоторых задачах оптимального управления допустимые управляющие воздействия на объект определяются ограничениями интегрального типа, называемыми также ограничениями на ресурс. Для определенных видов таких ограничений решение задачи об оптимальном управлении приводит к импульсным законам управления. Методы импульсной коррекции случайных возмущений, действующих на динамическую систему, изучались в книгах ГЛ. Гродзовского, Ю. Н. Иванова, В. В. Токарева45 J.
Ф.Л.Черноусько, В. Б. Колмановского J 196 ], в статьях В.Б.Колма-новского [ 73 «], М. Л. Лидова, Д. Е. Охоцимского, В. А. Рясина,.
Н.Н.Ченцова [ 139], Ф. Л. Черноусько [l93 ], В. А. Ярошевского, C.B. Петухова? 206 ] и других работах.
Проблемам управления при случайных возмущениях, возникающих при исследовании движения летательных и космических аппаратов, посвящены монографии И. А. Богуславского [ 19 J, В. А. Боднера? 21 ], Д. Е. Охоцимского, Ю. Ф. Голубева, Ю. Г. Сихарулидзе [ 138 «, В. М. Пономарева [ 145], А. А. Лебедева, М. Н. Красилыцикова, В. В. Малышева [I2l] и др
Большое внимание в последнее время уделяется разработке приближенных аналитических и численных методов решения уравнения Бел-лмана, позволяющих строить системы управления, близкие к оптимальным. Некоторые результаты, полученные в этом направлении, приведены в книгах Р. Л. Стратоновича175 j, Ф. Л. Черноусько, В. Б. Колмановского [l96 j и в статьях В. М. Вонэма, В. С. Кэшмена [ 224 J, В. Б. Колмановского ^ 73, У. Флеминга? 213 j| и др.
Из приведенного краткого обзора видно, что проблемам оптимального управления посвящено большое число исследований, что является одним из свидетельств актуальности темы данной диссертации. В то же время в связи с конкретными техническими задачами возникает ряд новых актуальных проблем синтеза автоматических систем управления при случайных возмущениях. Эти проблемы связаны с необходимостью разработки точных и приближенных методов расчета оптимальных регуляторов для специальных классов стохастических объектов управленияс построением оптимальных систем для широкого класса минимизируемых функционаловс разработкой универсальных методов синтеза, позволяющих учитывать различные усложняющие факторы, возникающие в реальных технических задачах.
Целью данной диссертационной работы являлось создание точных и приближенных методов синтеза оптимальных систем управления при различных предположениях о динамических свойствах объектов управления, характере возмущающих воздействий и типах критериев оптимальности. При этом большое внимание уделялось доведению предлагаемых способов синтеза до инженерных методов расчета, позволяющих находить структуру оптимальных (или квазиоптимальных) блоков управления и вычислять параметры элементов их функциональных схем.
Новые результаты, которые выносятся на защиту, связаны с постановкой и исследованием ряда новых задач синтеза стохастических оптимальных систем управления, разработкой методов решения этих задач. К таким результатам относятся:
1) структурный синтез оптимальных следящих систем по критерию минимума максимальной ошибки и при ограничениях на допустимую величину рассогласования, основанный на точных решениях стационарных уравнений Беллмана;
2) разработка приближенных методов синтеза стационарных и нестационарных систем оптимального демпфирования случайных колебаний при малых управляющих воздействиях;
3) построение квазиоптимальной системы управления скоростью резания токарных станков;
4) приближенное решение задач управления стохастическими объектами квазигармонического типа;
5) синтез квазиоптимальных управлений в стохастических системах со случайными параметрами;
6) разработка алгоритмов управления проветриванием выемочных участков угольных шахт;
7) условия сходимости процедуры приближенного синтеза, основанной на методе последовательных приближений;
8) интегральные оценки качества переходных процессов при квазиоптимальных управлениях в сравнении с оптимальными системами;
9) методики построения замкнутых систем автоматического регулирования, оптимальных по различным критериям качества.
Диссертация состоит из 6 глав.
В гл. I излагаются способы математической формализации различных стохастических задач оптимального управления, основанные на использовании метода динамического программирования. Формулируются задачи синтеза оптимальных автоматических систем, различающихся целями управления и степенью информированности о текущем состоянии объекта управления. В случае полной информации о состоянии получены дифференциальные уравнения Беллмана для задач синтеза систем, оптимальных по критерию минимума интегрального показателя качества, максимума среднего времени достижения границ и минимума максимального значения функции штрафа. Для задач управления на бесконечном временном интервале дано определение стационарного режима работы оптимальной автоматической системы и приведены соответствующие этому режиму стационарные уравнения Беллмана. Для задач с косвенными наблюдениями, когда случайные воздействия на систему являются марковскими процессами или процессами типа белого шума, указан способ построения пространства достаточных координат, являющегося областью определения решений уравнений Беллмана. Показано, что оптимальный регулятор в этом случае состоит из двух функционально различных блоков: блока оптимальной нелинейной фильтрации, формирующего достаточные координаты, и собственно управляющего блока, структура и параметры которого определяются путем решения уравнения Беллмана.
Гл. 2 посвящена точным методам синтеза автоматических систем. Наряду с линейно-квадратичными задачами оптимального управления рассмотрены некоторые стохастические задачи с ограниченными управляющими воздействиями, для которых удалось получить явные выражения для оптимального закона управления. Для системы слежения за блуждающей координатой, использующей в качестве исполнительного устройства серво-мотор с ограниченной скоростью, проведен структурный синтез для трех оптимальных систем автоматического управления, отвечающих различным критериям качества. Произведен сравнительный анализ системы, максимизирующей среднее время достижения границы, и системы, минимизирующей величину максимального рассогласования. Показано, что при соответствующем согласовании величины допустимых отклонений регулируемой величины от задающего воздействия и времени наблюдения за системой оптимальные регуляторы указанных двух систем имеют практически одинаковую структуру.
В гл. 3 рассмотрен один приближенный метод синтеза, позволяющий рассчитывать системы управления, близкие к оптимальным, когда диффузионные члены уравнения Беллмана являются малыми величинами (т.е. когда вторые производные функции потерь по фазовым переменным содержат малый параметр). В этом случае для приближенного синтеза используется метод последовательных приближений, позволяющий рассчитывать структуру квазиоптимальных регуляторов путем решения дифференциальных уравнений с частными производными первого порядка (вместо исходного уравнения Беллмана, имеющего второй порядок). Указанная процедура приближенного синтеза применена для расчета системы слежения за дискретным марковским процессом типа «телеграфного сигнала», когда измерение входного воздействия сопровождается помехами типа белого шума и имеются случайные возмущения, действующие на объект управления. Для стационарного режима слежения получены явные выражения для линий переключения и стационарных ошибок слежения, соответствующих первым двум приближениям. С помощью методов оптимальной нелинейной фильтрации получены также уравнения достаточных координат задачи. На основе результатов аналитического решения произведен структурный синтез квазиоптимальных следящих систем. Построены функциональные схемы квазиоптимальных регуляторов первого и второго приближения, содержащих существенно нелинейные элементы типа идеального реле. Указан способ реализации найденных регуляторов с помощью стандартных элементов аналоговой техники, позволяющий управлять системой в реальном масштабе времени.
В гл. 4 изучены стохастические задачи оптимального управления при малой величине управляющих воздействий. Разработана общая схема метода последовательных приближений для решения уравнений Бел-лмана эллиптического типа, отвечающих стационарному режиму работы автоматической системы. В данном случае расчет стационарной ошибки автоматической системы и алгоритма управления производится путем использования приближенных выражений для функции потерь, получаемых методом ортогональных разложений по системе собственных функций некоторой задачи Штурма — Лиувилля. Предложенная общая схема применена для приближенного решения задачи оптимального демпфирования случайных колебаний в колебательной системе с одной степенью свободы, возмущаемой белым шумом и управляемой скалярной «силой», ограниченной по модулю. Получены явные выражения для алгоритмов оптимального управления первых двух приближений, которые использовались при построении системы стабилизации скорости резания токарных станков, описанной в § 19 гл. 6 и внедренной на Коломенском станкостроительном производственном объединении. Предложенный метод приближенного синтеза использовался для аналитического конструирования квазиоптимальных систем управления не только при случайных возмущениях типа белого шума, но и в случае коррелированных помех марковского типа. Для системы стабилизации с коррелированными шумами в объекте и в цепи обратной связи найдена структура квазиоптимального регулятора и рассчитаны параметры его функциональных элементов.
Наряду со стационарными задачами в гл. 4 исследовались нестационарные задачи синтеза при малых управлениях. Для нестационарных задач было проведено исследование качества приближенного синтеза. С помощью интегральных оценок качества переходных процессов в квазиоптимальных системах установлено, что при малых управлениях использование квазиоптимальных законов управления первых двух приближений приводит к малым отклонениям критерия качества от оптимального значения. Найденные оценки качества служат обоснованием эффективности используемого в данной главе метода синтеза.
В гл. 4 исследована также возможность применения предложенной схемы последовательных приближений для синтеза квазиоптимальных систем при произвольных (ограниченных) управлениях. Показано, что для широкого класса задач синтеза используемый метод последовательных приближений является асимптотически оптимальным. При доказательстве асимптотической оптимальности метода одновременно установлена теорема существования и единственности решения уравнения Беллмана.
В заключение гл. 4 предложенный приближенный метод используется для решения задач управления стохастическими системами с распределенными параметрами. Приведен расчет квазиоптимальных алгоритмов управления (первые два приближения) для одной модельной задачи управления концентрацией вещества в трубопроводе конечной длины.
В гл. 5 рассматриваются стохастические задачи оптимального управления динамическими системами квазигармонического типа. Фазовые траектории этих систем близки к окружностям. Поэтому, если состояние таких систем задавать полярными координатами (амплитудой и фазой), то их скорости оказываются малыми величинами. Данная особенность квазигармонических систем позволила разработать приближенный метод синтеза оптимальных регуляторов, который является развитием и обобщением известного асимптотического метода Крылова-Боголюбова — Митропольского ^1б|на случай управляемых стохастических систем.
В основе излагаемого в гл. 5 приближенного метода лежит использование двух уравнений Беллмана — дифференциального и конечно-разностного (для интервала времени, равного квазипериоду), соответствующих решаемой задаче синтеза. Комбинируя указанные два уравнения, можно понизить размерность задачи и свести исходное двумерное (по фазовым переменным) уравнение Беллмана к одномерному. Решение полученного одномерного уравнения Беллмана находится методом последовательных приближений.
Данный метод применен для решения ряда стационарных задач оптимальной стабилизации случайных колебаний, а также в задаче о максимизации среднего времени достижения границ. Рассмотрен ряд конкретных примеров расчета оптимальных регуляторов релейного типа как для линейных объектов управления, так и для нелинейной автоколебательной системы в мягком режиме возбуждения, описываемой уравнением Ван дер Поля.
191 и !/.
В гл. б изучены некоторые адаптивные задачи синтеза задачи управления с ограничениями на фазовые переменные, произведен расчет квазиоптимальных систем управления проветриванием в угольных шахтах и стабилизации скорости резания токарных станков, а также приведены результаты исследования оптимальных и квазиоптимальных систем с помощью численных методов. Под адаптивными задачами здесь понимаются стохастические задачи синтеза, аналогичные рассмотренным в главах 1−5, решаемые при условии, что уравнения движения объекта управления содержат неизвестные параметры. Для решения таких задач разработан и обоснован регулярный асимптотический метод синтеза, эффективный при малой априорной неопределенности значений неизвестных параметров. Приведен пример приближенного синтеза регулятора в замкнутой автоматической системе с объектом управления в виде апериодического звена 1-го порядка с неизвестной постоянной времени.
В гл. б исследованы три задачи синтеза с ограничениями на фазовые координаты. Рассмотрены две следящие системы и одна система стабилизации. Исследование следящих систем проведено на примере системы слежения за блуждающей координатой, изученной в гл. 2, в предположении об ограниченности величины допустимых рассогласований между задающим воздействием и регулируемой величиной. Рассмотрены два типа ограничений, встречающихся в практических задачах, соответствующих отражающим и поглощающим экранам в граничных точках. Учет ограничений второго типа (поглощающих) необходим при проектировании систем синхронизации колебаний, использующих принцип фазовой автоподстройки. Для стационарного режима слежения задача синтеза оптимального регулятора сведена к решению алгебраического трансцендентного уравнения для точки переключения.
Исследованная в гл. 6 система стабилизации представляет собой систему управления объектом, динамика которого аналогична двумерному случайному блужданию броуновского типа, управляемому по одной из фазовых переменных. Область допустимых состояний системы цредставляет собой круг на фазовой плоскости. В точках окружности, ограничивающей этот круг, фазовые траектории отражаются внутрь круга по направлению нормали к границе. С помощью метода последовательных приближений гл. 4 найдены уравнения линий переключения, определяющих структуру квазиоптимальных регуляторов.
В гл. б приведены результаты численного решения задачи оптимального демпфирования случайных колебаний, изучавшейся в §§ 8, 10 гл. 4. Рассмотрен алгоритм решения разностного аналога двумерного уравнения Беллмана для данной задачи, построенный на основе локально-одномерного метода [162 ] и метода прогонки. Приведена, написанная на языке ФОРТРАН программа, реализующая этот алгоритм, и представлены результаты счета на ЭВМ. С помощью численных методов получены зависимости показателя качества и алгоритма оптимального управления от параметров задачи и времени, а также произведено сравнение оптимальной и квазиоптимальных систем, построенных на основе приближенных аналитических методов, предложенных в диссертации.
В гл. 6 изучена задача управления проветриванием выемочных участков угольных шахт. С помощью критерия качества, учитывающего метаносодержание на участке и энергозатраты на проветривание, сформулирована задача оптимального управления проветриванием. Для расчета алгоритма управления использовался метод последовательных приближений, предложенный в § 9 гл. 4 и позволяющий строить квазиоптимальные системы с высоким качеством проветривания и минимальными энергетическими затратами. Для первых двух приближений получены явные выражения для алгоритмов управления проветриванием, задающих интенсивность расхода воздуха в зависимости от аэрогазодинамических параметров участка и времени.
В заключение гл. 6 рассмотрена задача построения оптимальной системы стабилизации скорости резания для станков токарной группы, оснащенных унифицированной системой управления электроприводом, настроенной на модульный оптимум. Разработана схема стабилизации скорости резания, обеспечивающая минимальное значение интегральной оценки качества переходных процессов. Основу предложенной системы стабилизации составил алгоритм управления, полученный в § 8 гл. 4.
Таким образом, в диссертации разработаны методы точного и приближенного синтеза оптимальных автоматических систем при случайных возмущениях. С помощью развитых в диссертации методов проведен расчет ряда конкретных следящих систем и систем автоматической стабилизации. Предложенные методы являются достаточно универсальными и пригодны для решения задач управления, отличных от изученных в диссертации. Разработанные в диссертации методы синтеза могут использоваться при построении точных или приближенных алгоритмов оптимального управления движением подвижных объектов, а также при решении ряда задач экономической динамики, теории массового обслуживания и др.
Результаты диссертации практически использовались в ряде организаций при проведении работ прикладного характера, а также при проектировании конкретных систем управления и измерения. Так, алгоритм управления, разработанный в §§ 8, 19, использовался при построении регулятора скорости резания токарных станков на Коломенском станкостроительном производственном объединении. Результаты § 18 использовались при проектировании алгоритмической структуры и алгоритмического обеспечения автоматизированной системы управления проветриванием угольных шахт, разрабатываемой институтом «Гипроуглеавтоматизация». Результаты, содержащиеся в главах 3−5 диссертации, были использованы при разработке системы программного автоматического управления стендом для испытания двигателей внутреннего сгорания, при построении алгоритмов коррекции траектории, а также при решении задач управления непрерывными моделями экономической динамики в хоздоговорных научно-исследовательских работах, выполненных в Челябинском политехническом институте и Калининском государственном университете (имеются соответствующие акты). Материалы §§ 5, II, 16 включены в научно-исследовательскую работу «Анализ и синтез стохастических динамических систем синхронизации с запаздыванием», выполненную кафедрой Исследования операций Московского института электронного машиностроения по заказу предприятия МНИИРС (имеется акт внедрения результатов этой работы). Методы оптимальной нелинейной фильтрации использовались для нахождения рациональной структуры цифрового преобразователя угла в научно-исследовательской работе «Исследование и разработка цифрового преобразователя угла», номер гос. регистрации 1 819 004 724 (имеется акт внедрения) и при выборе оптимальных интервалов измерения в изобретении Г. Е. Колосова, А. Б. Пиуновского, Е. М. Рукина «Способ измерения атомной флуоресценции» (Авторское свидетельство СССР № 1 057 819, Бюллетень изобретений № 44, 1983 г.). Более" подробное описание практического использования результатов диссертации приведено в §§ 18, 19.
По теме диссертации опубликовано 27 печатных работ. Кроме того, по материалам диссертации автором написана монография «Синтез оптимальных автоматических систем при случайных возмущениях» -М.: Наука, Главная ред. физ.-мат. лит-ры, 1984 г.
Основные результаты диссертации были доложены автором на восьми Всесоюзных и четырех Международных конференциях, а также на семинарах и конференциях ряда организаций.
Большинство работ по теме диссертации, содержащихся в списке литературы |^79 — 104^, выполнены диссертантом самостоятельно. Относительно работ, выполненных в соавторстве, необходимо отметить следующее. Результаты гл. 3 отражены в совместной статье Г. Е. Колосова, Р. Л. Стратоновича Юо]. Постановка задач и рекуррентные формулы последовательных приближений гл. 3 принадлежат Р.Л.Стратоно-вичу, диссертантом получены уравнения достаточных координат и проведен синтез квазиоптимальных регуляторов первых двух приближений для стационарного режима слежения за разрывным марковским процессом.
Результаты §§ 7, 8 гл. 4 отражены в совместной статье Г. Е. Колосова, Р. Л. Стратоновича [Ю1]. Постановка задач §§ 7, 8 принадлежит Р. Л. Стратоновичу, схема приближенного синтеза была разработана авторами совместно, обоснование метода последовательных приближений и конкретные расчеты проведены диссертантом.
Результаты § 13 гл. 5 отражены в совместных статьях Г. Е. Колосова, Р. Л. Стратоновича [102, ЮЗ]. В диссертацию включены только те результаты статей 10з|, которые получены диссертантом.
Результаты § 15 гл. 6 отражены в совместной работе Г. Е. Колосова, А. Ф. Хохлова [Ю4]. В диссертацию включены только те результаты работы которые получены диссертантом.
Основные результаты работы состоят в следующем:
1. При учете ограничений на допустимые управления получены точные решения задач синтеза и произведен структурный синтез оптимальных регуляторов, обеспечивающих максимум времени достижения границ, а также минимум максимального рассогласования на заданном временном интервале.
2. Построена функциональная схема и рассчитаны параметры квазиоптимальной автоматической системы слежения за разрывным марковским процессом, когда интенсивность случайных воздействий на объект мала, а помехи наблюдения велики.
3. Предложен эффективный метод приближенного синтеза оптимальных систем при малых управляющих воздействиях. Доказаны оценки погрешности метода. Установлена асимптотическая сходимость предложенного метода последовательных приближений к точному решению задачи синтеза. Предложенный метод использован для расчета конкретных стохастических систем управления с сосредоточенными и распределенными параметрами.
4. Разработана квазиоптимальная система управления скоростью резания токарных станков. Предложенная функциональная схема регулятора реализована в экспериментальном образце системы, который прошел испытания на Коломенском станкостроительном производственном объединении. Испытания показали, что предложенная система управления скоростью позволяет повысить класс точности обработки деталей и увеличить производительность труда на станках токарной группы.
5. Предложен метод приближенного решения задач оптимального управления для квазигармонических объектов, являющийся обобщением асимптотического метода Крылова-Боголюбова-Митропольского на случай управляемых стохастических систем. На основе предложенного метода проведен расчет и получены функциональные схемы ряда конкретных систем.
6. Предложен асимптотический метод решения уравнения Беллмана (и задач синтеза) для задач управления стохастическими объектами, содержащими неизвестные параметры. Обоснован способ приближенного построения этого решения и проведена оценка качества приближенного синтеза.
7.Разработан алгоритм управления проветриванием выемочных участков угольных шахт с малыми энергетическими затратами.
8. Получены точные и приближенные решения задач синтеза оптимальных управлений в задачах с ограничениями на фазовые координаты.
9. Проведено численное решение уравнения Беллмана, отвечающего задаче оптимальной стабилизации случайных колебаний в колебательной системе с одной степенью свободы. Результаты численного исследования показали эффективность приближенных аналитических методов синтеза оптимальных регуляторов, предложенных в диссертации.
10. Разработанные в диссертации методы синтеза использованы при разработке программного автоматического управления стендом для испытания двигателей внутреннего сгорания, при расчете систем стабилизации движения вблизи программной траектории, при проектировании специализированных систем фазовой автоподстройки, при выборе структуры цифрового преобразователя угла для специальной аппаратуры и в других научно-исследовательских разработках.
ЗАКЛЮЧЕНИЕ
.
В диссертации поставлен и исследован ряд новых проблем теории оптимального управления при случайных возмущениях. Разработаны точные и приближенные методы синтеза оптимальных автоматических систем для различных классов объектов управления, критериев оптимальности при различных типах случайных воздействий на систему, включая задачи с неполной информацией о вероятностных свойствах случайных процессов. Развитые в диссертации методы исследования оптимальных систем носят универсальный характер и могут использоваться при решении широкого круга задач комплексной автоматизации производственных процессов при неполной информации.
Совокупность этих методов можно рассматривать как новое перспективное направление в теории оптимального управления стохастическими системами и в приложении этой теории к изучению и расчету различных конкретных систем автоматического управления.
Список литературы
- Акуленко Л.Д., Колмановский В. Б. Об одной модельной задаче управления движением твердого тела в атмосфере при случайных возмущениях. Изв. АН СССР. Механика твердого тела, 1975, № 2.
- Андреев Н.И. Теория статистически оптимальных систем управления. М.: Наука, 1980.
- Андронов A.A., Витт A.A., Хайкин С. Э. Теория колебаний. М.: Изд-во физико-математич. лит-ры, 1959.
- Аоки М. Оптимизация стохастических систем. М.: Наука, 1971.
- Афанасьев В.Н. Математическое конструирование оптимальных систем управления. М.: Московский ин-т электронного машиностроения, 1977.
- Бачура-Рид А. Т. Элементы теории марковских процессов и их приложения. М.: Наука, 1969.
- Батков A.M. и др. Методы оптимизации в статистических задачах управления. М.: Машиностроение, 1974.
- Беллман Р. Динамическое программирование. М.: Изд-во иностр. лит-ры, I960.
- Беллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964.
- Беллман Р., Гликсберг И., Гросс 0. Некоторые вопросы математи-. ческой теории процессов управления. М.: Изд-во иностр. лит-ры, 1962.
- Беллман Р., Калаба Р. Теория динамического программирования и системы управления с обратной связью. Труды I конгресса ИФАК. Теория дискретных, оптимальных и самонастраивающихся систем. -М.: Изд-во АН СССР, 1961.
- Беллман Р., Энджел Э. Динамическое программирование и уравнения в частных производных. М.: Мир, 1974.
- Бесекерский В.А., Попов Е. П. Теория систем автоматического регулирования. -М.: Наука, 1975.
- Боголюбов Н.Н., Митропольский Ю. А. Асимптотические методы в теории нелинейных колебаний. М.: Наука, 1974.
- Богуславский И.А. Об уравнениях стохастического управления. -Автоматика и телемеханика, 1966, № II.
- Богуславский И.А. О синтезе стохастического оптимального управления. В кн.: Современные методы проектирования систем автоматического управления. — М.: Машиностроение, 1967.
- Богуславский И.А. Методы навигации и управления по неполной статистической информации. М.: Машиностроение, 1970.
- Богуславский И.А., Егорова А. В. Стохастическое оптимальное управление движением при несимметричном ограничении. Автоматика и телемеханика, 1972, № 8.
- Боднер В.А. Теория автоматического управления полетом. М.: Наука, 1964.
- Бородовский М.Ю., Братусь А. С., Черноусько Ф. Л. Оптимальная импульсная коррекция при случайных возмущениях. Прикл. матем. и мех., 1975, т. 39, вып. 5.
- Брайсон А., Хо Ю-ши. Прикладная теория оптимального управления. М.: Мир, 1972.24