Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Содержание

ГЛАВА 1. Предварительные сведения из теории линейных систем управления и понятие оптимальности почти наверное и по вероятности
- 1. Линейные дискретные системы управления: основные понятия
- 2. Задача оптимального регулирования
- 3. Оптимальность по вероятности и почти наверное в задачах динамического управления
ГЛАВА 2. Задача линейного регулятора, возмущенного последовательностью зависимых случайных величин, для случая постоянных параметров
- 1. Постановка задачи
- 2. Основные результаты по стохастической оптимальности
- 3. Вспомогательные утверждения
- 4. Доказательства основных результатов
ГЛАВА 3. Задача линейного регулятора, возмущенного последовательностью зависимых случайных величин, для случая переменных параметров
- 1. Постановка задачи
- 2. Основные результаты по стохастической оптимальности
- 3. Доказательства
ГЛАВА 4. Применение полученных результатов к задаче пенсионного финансирования
- 1. Оптимальное финансирование пенсий как задача динамического управления
- 2. Стохастическая оптимальность в задаче пенсионного финансирования

Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин (реферат, курсовая, диплом, контрольная)

1. Описание области исследования. Диссертация посвящена исследованию стохастической оптимальности в задачах динамического управления, возникающих, в частности, в некоторых экономических приложениях.

Рассматривается линейная динамическая система управления с квадратичным целевым функционалом, возмущенная последовательностью определенным образом зависимых случайных величин. Для исследования стохастической оптимальности используются так называемые вероятностные критерии, связанные с изучением асимптотического поведения (в некотором вероятностном смысле) интегрального целевого функционала, когда горизонт планирования стремится к бесконечности.

Известно, что традиционные подходы в теории стохастической динамической оптимизации основаны на исследовании математических ожиданий (м.о.) указанных целевых функционалов. Точнее, если задача рассматривается на фиксированном конечном интервале времени, то сравниваются м.о. функционала для разных управлений.

В случае, если система может рассматриваться на бесконечном интервале времени, сравнивается асимптотическое поведение м.о. функционала, когда горизонт планирования стремится к бесконечности. Управления, являющиеся решением соответствующих экстремальных задач, если они существуют, в дальнейшем называются управлениями, оптимальными в среднем (на конечном или бесконечном интервале времени). В частности, управлением оптимальным в среднем на бесконечном интервале времени обычно называется управление, минимизирующее верхний предел среднего по времени м.о. целевого функционала.

С помощью вероятностных критериев определяется более сильное в некотором смысле свойство оптимальности по сравнению с оптимальностью в среднем. Точнее, исследуются управления, доставляющие экстремум не только м.о. целевого функционала, но и самому функционалу (при некоторой нормировке, зависящей от длины интервала планирования) с вероятностью, асимптотически близкой к единице при больших интервалах.

Исследованию в указанной области посвящено большое количество работ, в которых рассматриваются некоторые частные модели, такие как линейная система с квадратичным функционалом (линейный регулятор — см. [42],[34],[38], [14], [37] для случая дискретного времени, [48],[1], [32], [17] для случая непрерывного времени) или ARMAX-модель ([30]), так и управляемые процессы достаточно общего вида ([18],[21], [23],[И],[12],[40], [31]).

2. Постановка задачи исследования стохастической оптимальности для управляемой марковской цепи. Пусть управляемая марковская цепь xt, t = 0,1,2,., со значениями в И1 описывается рекуррентным соотношением xt = ht (Zhxt-i, at), (1) где • • • - независимые случайные величины (с.в.), — элемент пространства Rm и ht: R х R/ х Rm Rl, t = 1,2,., — некоторые измеримые функции. Будем интерпретировать at как решение, принимаемое в момент t.

Ниже для любой последовательности элементов ai, с*2,. положим а1 = («!,., а ().

Пусть xq = х — начальное состояние цепи, которое в дальнейшем будем считать фиксированным. Для любого целого Т > 1 рассмотрим функционал.

MaT) = Y, qt (xt, at), (2) t=1 где Xt удовлетворяет (1) при xq = х, а измеримая функция qt определяет цену управления в момент времени t.

В качестве класса U допустимых управлений будем рассматривать класс всевозможных неупреждающих управлений, т. е. случайных процессов ui, u2,., где щ — с.в., измеримая относительно <�т-алгебры.

Ft-1 = 1}.

Для Т > 1 будем обозначать {0,Т} интервал времени {t: t = 0,1, ., Т}. Управление йт называется оптимальным в среднем на интервале {0,Т}, если.

E{Jr (nT)} = infE{JT (UT)}, и1 где inf берется по множеству ЫТмножеству всех сужений ит управлений {u, ii2,.} из U. Ясно, что йт, если оно существует, может зависеть от Т, так что, рассматривая последовательность {йт}, мы имеем дело со схемой серий {щт,.

В случае, когда горизонт планирования неограниченно возрастает (Т —> оо), классической является постановка задачи минимизации ожидаемых средних за единицу времени потерь (долговременного среднего): limsup^Е Jt (u) min. т^оо т W пей.

Аналогичная постановка рассматривается также в случае непрерывного времени, в частности для управляемых диффузионных процессов.

Концепция стохастической оптимальности как в случае дискретного, так в случае непрерывного времени возникает в задаче на бесконечном интервале времени. В различных работах на эту тему наблюдается различие в терминологии и определениях — это «оптимальность в смысле закона больших чисел» ([45]), «в смысле центральной предельной теоремы», или «по распределению» ([10], [46]), «асимптотическая оптимальность по вероятности и п.н.» ([14], [15]), «overtaking» оптимальность п.н. ([39]) и др.

При этом многие определения стохастической оптимальности связаны с предположением эргодичности процесса, соответствующего оптимальному в среднем управлению. Так как для этого процесса эргодическое среднее сходится к ожидаемому среднему значению, и это значение минимально, то можно сравнивать его, в частности, с любым конкурирующим эргодическим, также и в стохастическом смысле. (При отсутствии эргодичности у конкурирующего процесса обычно рассматривается верхний предел среднего по времени значения функционала).

Соотвествующее понятие стохастической оптимальности в рамках описанной выше, а также аналогичных других постановок связано с определением, при котором:

1)существует управление й и число 0, такие что:

Шп Г" 17 г («) = е, (3).

2)для любого допустимого управления и: limsupT" 1 Jt{u) > Э. (4).

Г-юо.

Заметим, что данное определение является достаточно ограничительным. В общем случае, например для неоднородных схем, предел в левой части (3) может не существовать или может равняться не числу, а случайной величине. Если все же для управления й условие (3) выполнено, то из (4) следует неравенство: limsupT-1 Jt (и) > lim Т" 1 Jt (й) •.

Т-" оо оо.

Ясно, что более строго и желательно, если это возможно, иметь дело с liminf, а не с limsup, как в данном неравенстве.

Указанная постановка задачи, а так же и некоторые другие постановки, связанные с исследованием стохастической оптимальности, либо накладывают исходные ограничения на свойства процесса, (например, однородность, ограниченность множества состояний), либо приводят к сильным ограничениям на класс допустимых управлений (см. [45], [46], [23]).

В данной работе мы будем придерживаться концепции «асимптотической оптимальности почти наверное и по вероятности», предложенной В. И. Ротарем в [18], и развитой затем в работах [21, 32, 17, 1], связанной с изучением асимптотического поведения разности значений функционалов для оптимального в среднем и произвольного управления. Положительную часть указанной разности в дальнейшем будем называть процессом дефекта оптимального (в среднем) управления.

Соотвествующее определение стохастической оптимальности обобщает многие другие постановки и позволяет избежать многих ограничений, таких как однородность, эргодичность и т. д.

Для любого действительного числа d обозначим d+ = d, если d > 0, и d+ = 0, если d < 0.

Определение. Пусть g = {дт}т=о ~ некоторая положительная невозрастающая последовательность чисел. Последовательность управлений (п.у.) и* = {и*Т}, и*т? Ыт, называется.

1) оптимальной почти наверное (п.н.) с весовой функцией д, или д-оптимальной п.н., если для любой п.у. и = {иТ}, ит? Ыт, при Т —> со дт{Ыи*Т) — МиТ))+ 0 п.н.- (5).

2) оптимальной по вероятности с весовой функцией д, или д-оптимальной по вероятности, если для любого? > 0 и любой п.у. и = {иТ}, ит? Ыт, при Т -> оо р (iдт (Ми*т) — Jt (ut)) > е) о. (6).

Данное определение введено В. И. Ротарем ([21]) для случая 9 т = Т~г и обобщено Di Mazi G.B. и Ю. М. Кабановым ([32]) на случай произвольных.

9 т, имеющих скорость стремления меньшую Т-1 (соответствующие вероятностные критерии были названы «чувствительными»).

Заметим, что управления с указанным свойством существуют при более слабых условиях, чем в (3)-(4). Кроме того, данный подход позволяет изучать более тонкие свойства оптимальных управлений, рассматривая верхние функции (или оценки скорости роста) для процесса дефекта, которые могут иметь порядок стремления к бесконечности гораздо меньший, чем у длины интервала планирования ([1],[17]).

Отметим также, что введенное определение включает в себя многие определения, встречающиеся в литературе. Если весовая функция равна константе в (5), то получается «оуейа1аг^» оптималыюсть п.н., если 9 т = f в (5) — асимптотическая оптимальность п.н., если 9 т = Ь в (6) — асимптотическая оптимальность по вероятности, если 9 т = -оптимальность по распределению.

3. Связь чувствительных вероятностных критериев стохастической оптимальности и верхних функций для процесса дефекта. В большинстве задач динамической оптимизации кандидатом на роль асимптотически оптимального в том или ином вероятностном смысле управления выступает управление, оптимальное в среднем. Тогда при рассматриваемой нами постановке задача исследования стохастической оптимальности может ставиться как задача получения асимптотических верхних оценок 1гт (различных типов) для скорости возрастания процесса дефекта оптимального в среднем управления при стремлении горизонта планирования Т к бесконечности.

Тип оценки связан с типом критерия, или исследуемой оптимальности — g-оптималыюсти по вероятности или п.н., где дт — функция, некоторым образом связанная с Ду.

Оценка при исследовании^{-оптимальности} по вероятности гарантирует стремление к нулю вероятности выхода за границу кт процесса дефекта. При исследованиии^{-оптимальности} п.н. соответствующая функция дает асимптотическую верхнюю оценку с вероятностью единица для скорости роста того же процесса дефекта (является для него верхней функцией).

Соответствующая^{-оптимальность} в обоих случаях тогда имеет место по крайней мере для функции вида 9 т = о (1/ Jit), что означает стремление к нулю (по вероятности или почти наверное) процесса дефекта, умноженного на функцию д.

Получение наилучших оценок указанных типов связано с понятием таких чувствительных вероятностных критериев, при которых скорость возрастания процесса дефекта оценивается с максимально возможной точностью. При этом чувствительность критерия определяется соответствующей (неслучайной) весовой функцией от горизонта управления, при умножении на которую гарантируется стремление процесса дефекта к нулю по вероятности или почти наверное.

Для модели линейного регулятора с непрерывным временем в ([1]) была получена наилучшая оценка при исследовании^{-оптимальности} п.н. Было показано, что для процесса дефекта, соответствующего оптимальному в среднем на бесконечном интервале управлению, такой оценкой является функция Нт = Ь In Т, где Ь — некоторая константа, что соответствует р-оптималыюсти п.н. для функции вида 9 т = о (1/1пТ).

Кроме того, в ([17]) было показано, что оценкой при исследованиии д-оптимальности по вероятности в той же модели является любая функция hx, стремящаяся к бесконечности, что соответствует^{-оптимальности} по вероятности указанного управления для любой функции вида 9 т — о (1).

4. Модель линейного регулятора и стохастическая оптимальность. Обобщение модели, рассматриваемое в данной работе. Модель линейного регулятора с дискретным временем исследовалась относительно стохастической оптимальности в [15], [14], где были получены результаты для случая дт = Т~1. Стохастическая оптимальность для линейных управляемых систем обсуждалась также в [11] (а для случая непрерывного времени в [12]), где рассматривается более общий случай и для управляемой марковской цепи, а также для общей схемы динамической оптимизации приводятся некоторые условия, при которых п.у. й = {ит} является Т~^оптимальной по вероятности и почти наверное. В силу общности постановки задачи эти условия являются достаточно ограничительными, например, в случае линейных систем они приводят к требованию ограниченности цены управления, что не имеет место в случае линейного регулятора.

Приведем здесь обобщение модели линейного регулятора с дискретным временем, которое рассматривается в данной работе.

Пусть Xt — случайный процесс со значениями в пространстве Rп, t = 0,1,2,. и xt = At xt! +Bt щ +Gt Сt + % (7) где (t, t = 1,2,. — некоторый (описанный ниже) случайный процесс со значениями в пространстве Rdслучайный вектор щ со значениями в Rm — неупреждающее управление в момент tqt, t = 1,2,. — некоторая последовательность неслучайных векторов в RnAt, Bt, Gt — матрицы соответствующих размеров. Начальное состояние хо фиксировано.

Пусть случайный процесс (t, t = 1,2,. описывается соотношением:

Ct = Rit Ct-i + Rat Ct-2 +••• + Rat Ct-s + (8) где t = 1,2,. — независимые случайные векторы (с.век.) со значениями в Rd, такие что = 0, матрицы ковариаций = Е^^'- Ru, i = l,., s — некоторые матрицы размера d х d CojC-ь C-(s-i) «заданные неслучайные векторы.

Для каждого натурального Т определим целевой функционал:

МиТ) = Е (x'tCtXt + u’t Dtut), (9) t=i где Ct, Dt, t = 1,2,. — симметрические матрицы соответствующих размеров, причем матрица Ct — неотрицательно определенные, a Dtположительно определенные.

Модель (7)-(9) представляет собой модель линейного регулятора, возмущенного последовательностью зависимых случайных величин. При этом классическая модель линейного стохастического регулятора получается из описанной, если в (7) использовать следующие параметры: Gt, t = 1,2,., — единичные матрицы, Rn, г = 1, s, qt, t = 1,2,., -нулевые матрицы.

С помощью введения расширенного вектора состояния данная задача может быть сведена к классической задаче линейного регулятора большей размерности. Однако специфика полученной таким образом задачи регулятора состоит в том, что в общем случае не выполнены некоторые стандартные условия на параметры модели (в частности, стабилизируемость), которые, с одной стороны, обеспечивают существование установившегося оптимального управления при стремлении горизонта планирования к бесконечности, а с другой стороны, существенно используются при доказательствах утверждений, связанных со стохастической оптимальностью (см. пример в главе 4). Кроме того, для линейного регулятора с дискретным временем исследовалась только стохастическая оптимальность, соответствующая делению процесса дефекта на длину интервала планирования. В данной ситуации с учетом излагаемых ниже потребностей, связанных с экономическими приложениями, задача линейного регулятора, возмущенного последовательностью зависимых (описанным выше образом) случайных величин, требует отдельного рассмотрения.

В классических задачах возмущения обычно описываются белым шумом, что в случае дискретного времени соответствует последовательности независимых случайных величин. Однако в ряде экономических приложений наблюдается зависимость возмущающих переменных в разные моменты времени. В частности, это имеет место в приведенной в главе 4 модели финансирования пенсионного фонда. Задача оптимального финансирования рассматривается как задача динамического управления (обзор подобных постановок можно найти, например, в [20]), где изменение состояние системы (величина резерва пенсионного фонда) формально описывается линейной управляемой системой, возмущенной последовательностью случайных величин, образующих случайный процесс типа авторегрессионного (этот процесс описывает пенсионные выплаты), и некоторой неслучайной функцией времени.

5. Описание модели пенсионного финансирования. Пусть задана планируемая траектория развития фонда, описываемая соотношением л (г, = (1+р,)№+4г)-Р? (ю) где, с[г) — так называемые целевые (рассчитанные с помощью какого-либо актуарного метода (см, например, обзор в [20])) значения размера фонда и суммарных пенсионных взносов на основе прогнозируемых суммарных пенсионных выплат p[r t = 1,2,., pt — (неслучайная) ставка инвестиционной доходности на периоде [t — l, t), ffl = /о — известное начальное состояние. В реальности за счет колебаний случайных факторов (инфляции, инвестиционной доходности, смертности) происходит отклонение траектории развития фонда от планируемой. В качестве источника неопределенности будем здесь рассматривать колебания численности популяции участников пенсионной схемы, в частности, за счет смертности (этот риск особенно важен для схем, небольших по числу участников). Точнее, предположим, что суммарные пенсионные выплаты pt, t = 1,2,., удовлетворяют соотношению pt = auPt-l + a2tPt-2 +. + CletPt-af (И) где ац > 0, i = l,., s, ?i,?2>— - независимые с.в., Е&- = 0, = of, po, p-i, ., p (si) — фиксированные (неслучайные) числа. Тогда динамика реального размера фонда описывается соотношением ft = (1 + pt) ft-1 + <нpt, (12) где ct, t = 1,2,., — суммарные пенсионные взносы, рассматриваемые как неупреждающее управление, /о — указанное выше начальное состояние.

Актуарные методы финансирования пенсий предполагают создание механизма коррекции отклонений от планируемой траектории развития фонда. Чтобы поставить задачу выбора оптимального способа такой коррекции как задачу оптимального динамического управления, выделим, следуя [33], два основных риска, с которыми сталкивается пенсионная схема: риск размера вклада (характеризует стабильность) и риск платежеспособности (характеризует безопасность). Тогда целевой функционал, учитывающий оба вида риска, имеет вид.

Мст) = hftfh2+Hot — 4r))2, (is) t=i где kt > 0, t = 1,2,.

Задача (10)-(13) сводится к одномерному линейному регулятору, возмущенному последовательностью зависимых случайных величин, тем самым представляет частный случай модели (7)-(9).

6. Цели и задачи работы. Краткое описание методов и основных результатов.

Целью диссертации является исследование^{-оптимальности} по вероятности и п.н. в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин, описываемой соотношениями (7)-(9), а также применение полученных результатов в теории пенсионного финансирования.

В соответствии со сформулированной целью задачи диссертации можно определить следующим образом:

1. Найти управление, оптимальное в среднем в задаче (7)-(9);

2. Исследовать условия, при которых управление, оптимальное в среднем, является^{-оптимальным} по вероятности и п.н.;

3. Выяснить возможный порядок стремления к нулю весовых функций g;

4. Применить полученные результаты к модели пенсионного финансирования (10)-(13).

Методы, используемые при решении поставленных задач, кратко можно охарактеризовать следующим образом.

Прежде всего, исследуемая задача линейного дискретного регулятора, возмущенного последовательностью зависимых случайных величин, приводится к виду классического регулятора. Далее доказательство стохастической оптимальности основывается на представлении (для каждого фиксированного Т) процесса дефекта, включающем некоторый мартингал (точнее, значение некоторого мартингала в момент Т) и его квадратическую характеристику. Указанное представление является дискретным аналогом предложенного в [17] и используемого также в [1] представления для линейного регулятора с непрерывным временем.

Однако исследование асимптотического поведения этого процесса в дискретном случае оказалось в некотором смысле более сложным по сравнению с аналогичным исследованием в случае непрерывного времени. Это потребовало разработки нового подхода, использующего свойства некоторого специального преобразования для мартингалов с равномерно ограниченными мартингал-разностями в сочетании со специфическим методом усечения для мартингала, участвующего в указанном представлении процесса дефекта, и применению предельных теорем для зависимых слагаемых.

Кроме того, следует заметить, что в силу специфики рассматриваемого приложения задача не свелась к исследованию стохастической оптимальности для классической модели линейного регулятора в обычной ситуации, когда существует установившийся оптимальный закон управления.

Это, с одной стороны, является обоснованием того, что в диссертации исследуется стохастическая оптимальность только в рамках схемы серий оптимальных в среднем управлений. С другой стороны, при построении упомянутых выше усечений это потребовало дополнительного изучения свойств некоторых функций от параметров модели в рассматриваемом специфическом случае, в частности, свойств, связанных с параметрами регрессии в исходной постановке. При этом наряду с методами теории мартингалов использовались также методы динамического программирования.

В работе получены следующие основные результаты:

1. Для модели линейного стохастического регулятора, возмущенного зависимыми случайными величинами, описываемой соотношениями (7)-(9), был получен вид оптимального в среднем управления.

2. При исследовании д-оптималыюсти по вероятности и п.н. в модели (7)-(9) с постоянными и с переменными параметрами определен порядок стремления к нулю весовых функций д и тем самым получены оценки скорости роста процесса дефекта оптимального управления. Показано, что эти оценки связаны с параметрами возмущающего процесса. При этом исследованы следующие ситуации:

1) случайные величины «возмущений», входящих в описание процесса авторегрессионного типа, являются независимыми равномерно ограниченными с вероятностью единица случайными величинами с нулевым математическим ожиданием;

2) случайные величины «возмущений», входящих в описание процесса авторегрессионного типа, являются независимыми с нулевым математическим ожиданием и конечными моментами различных порядков.

3. Полученные результаты относительно стохастической оптимальности в задаче линейного стохастического регулятора, возмущенного зависимыми случайными величинами (7)-(9), использованы в модели пенсионного финансирования как задаче оптимального динамического управления (10)-(13).

Новизна полученных результатов состоит в следующем:

1. Для классической модели линейного регулятора в дискретном времени:

1) улучшен порядок весовой функции дт, при которой имеет место д-оптималыюсть п.н. и по вероятности по сравнению с известными результатами (см. 14],[15]).

2) Для дт = Т~1 ослаблены условия на моменты случайных возмущений, полученные ранее в [14]-[15], при которых соответствующая стохастическая оптимальность имеет место.

2. Результаты, полученные для линейного регулятора, возмущенного последовательностью зависимых случайных величин, рассматриваемого как классический линейный регулятор большей размерности, являются новыми как в силу вышеуказанного п. 1, так как и в силу того, что они не опираются на существование установившегося при Т оо оптимального закона управления.

3. Для получения результатов не требуется ограниченность неслучайной функции времени входящей в «возмущение», в то время как в полученных ранее результатах (см. [1] для случая непрерывного времени) эта ограниченность являлась одним из существенных условий при доказательстве стохастической оптимальности.

4. В используемой нами постановке модель пенсионного финансирования до сих пор, насколько нам известно, не рассматривалась, при этом исследование стохастической оптимальности по отношению к модели пенсионного финансирования как модели оптимального динамического управления проводилось впервые.

7. Описание содержания диссертации. Диссертация состоит из введения, четырех глав, заключения и списка литературы.

ЗАКЛЮЧЕНИЕ

В диссертации было проведено исследование стохастической оптимальности в модели линейного регулятора с дискретным временем, возмущенного последовательностью определенным образом зависимых случайных величин.

Для исследования стохастической оптимальности были использованы вероятностные критерии, с помощью которых определяется более сильное в некотором смысле свойство оптимальности по сравнению с оптимальностью в среднем, когда минимизируется м.о. целевого функционала. Точнее, была использована концепция «асимптотической оптимальности почти наверное и по вероятности», предложенная В. И. Ротарем, и развитая затем в работах Ю. М. Кабанова, Э. Л. Пресмана, Т. А. Белкиной и связанная с изучением асимптотического поведения разности значений функционалов для оптимального в среднем и произвольного управления. Положительная часть указанной разности называется процессом дефекта оптимального в среднем управления. Такой подход, обобщая и улучшая многие другие, позволяет также расширить постановку задачи, введя понятие чувствительных вероятностных критериев, и рассматривая оценки скорости роста для процесса дефекта, которые могут иметь порядок стремления к бесконечности гораздо меньший, чем у длины интервала планирования. При этом чувствительность критерия определяется соответствующей (неслучайной) весовой функцией от горизонта управления, при умножении на которую гарантируется стремление процесса дефекта к нулю по вероятности или почти наверное.

Модель линейного регулятора, исследуемая в данной работе, является обобщением классической модели стохастического линейного регулятора. Однако, в общем случае параметры возмущающего процесса могут быть такими, что соответствующая классическая модель большей размерности, получаемая из исходной введением расширенного вектора состояния, обладает некоторой спецификой по сравнению со стандартной ситуацией. Указанная особенность состоит в том, что может не существовать установившейся оптимальный закон управления при стремлении горизонта планирования к бесконечности. Кроме того, ранее для линейного регулятора с дискретным временем исследовалась только стохастическая оптимальность, соответствующая делению процесса дефекта на длину интервала планирования.

Необходимость рассмотрения такого обобщения классической модели возникла из потребности, связанной с экономическими приложениями. В классических задачах возмущения обычно описываются белым шумом, что в случае дискретного времени соответствует последовательности независимых случайных величин. Однако в ряде экономических приложений наблюдается зависимость возмущающих переменных в разные моменты времени. Например, в рассматриваемой в диссертации модели финансирования пенсионного фонда состояние системы (величина резерва пенсионного фонда) формально описывается линейной управляемой системой, возмущенной последовательностью случайных величин, образующих случайный процесс типа авторегрессионного (этот процесс описывает пенсионные выплаты), и некоторой неслучайной функцией времени. Соответствующую задачу оптимального управления можно охарактеризовать как задачу одномерного линейного регулятора, возмущенного последовательностью зависимых случайных величин.

В общем многомерном случае для исследования стохастической оптимальности был использован мартингальный подход. После приведения исследуемой модели к классическому виду дефект целевого функционала представляется как величина, включающая некоторый мартингал и его квадратическую характеристику. Исследование асимптотического поведения этого процесса в дискретном случае является в некотором смысле более сложным по сравнению с аналогичным исследованием в случае непрерывного времени. Это потребовало разработки нового подхода, использующего с использованием различных приемов и методов теории вероятностей и стохастической теории управления.

В диссертации для модели линейного стохастического регулятора, возмущенного зависимыми случайными величинами были получены оценки скорости роста процесса дефекта и установлена соответствующая оптимальность по вероятности и почти наверное оптимального в среднем управления при больших временных горизонтах. Показано что эти оценки связаны с параметрами возмущающего процесса.

При этом исследованы следующие ситуации:

2) случайные величины «возмущений» входящих в описание процесса авторегрессионного типа, являются независимыми с нулевым математическим ожиданием и конечными моментами различных порядков.

Как частный случай, эти полученные оценки скорости роста процесса дефекта включают оценки для классического линейного регулятора с дискретным временем и они имеют лучший порядок по сравнению с известными результатами. Кроме того, указанные оценки остаются справедливыми и в случае, когда не выполнены условия, гарантирующие существование установившегося при стремлении горизонта планирования к бесконечности оптимального закона управления.

Следует также отметить, что в полученных ранее результатах при исследовании стохастической оптимальности одним из существенных условий является ограниченность неслучайной функции времени, входящей в возмущение. Однако, для результатов, полученных в диссертации, эта ограниченность не требуется.

Полученные результаты относительно стохастической оптимальности в задаче линейного регулятора использованы в модели пенсионного финансирования как задаче оптимального динамического управления. В используемой нами постановке модель пенсионного финансирования до сих пор, насколько нам известно, не рассматривалась, при этом исследование стохастической оптимальности по отношению к модели пенсионного финансирования как модели оптимального динамического управления проводилось впервые.

Показать весь текст

Список литературы

Белкина Т.А., Кабанов Ю. М., Пресман Э. Л. О стохастической оптимальности для линейно-квадратического регулятора. Теория вероятностей и ее применения, 2003, т. 48, вып. 4, с. 661−675.
Белкина Т.А., Лёвочкина М. С. Исследование модели оптимального управления негосударственным пенсионным фондом. В сб. «Математические модели экономики», М.:МИЭМ, 2002, с. 36−44.
Белкина Т.А., Лёвочкина М. С. Применение методов динамического управления в задаче определения пенсионных взносов. В сб. «Моделирование механизмов функционирования экономики России на современном этапе», вып. 6. М.:ЦЭМИ РАН, 2002, с.99−106.
Белкина Т.А., Лёвочкина М. С. О вероятностном критерии оптимальности в задаче управления негосударственным пенсионным фондом. Обозрение прикладной и промышленной математики, т. 2, вып. 2, М.: «ОПиПМ», 2003, с. 337−338.
Белкина Т.А., Лёвочкина М. С. О стохастической оптимальности в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин. Обозрение прикладной и промышленной математики, т.11, вып. 2, М.: «ОПиПМ», 2004, с. 234−236.
Белкина Т.А., Лёвочкина М. С. О стохастической оптимальности в задаче определения пенсионных взносов. В сб. «Анализ и моделирование экономических процессов», вып. 1, М.:ЦЭМИ РАН, 2004, с.81−94.
Лёвочкина М.С. Об асимптотической оптимальности по вероятности в задаче управления негосударственным пенсионным фондом. -Тезисы научно-технической конференции студентов, аспирантов и молодых специалистов института МИЭМ, М.:МИЭМ, 2004, с.529−530.
Белкина Т.А., Лёвочкина М. С. Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин. Дискретная математика, т.18, вып.1, 2006, с.126−145.
Белкина Т.А., Пресман Э. Л. Асимптотически оптимальные по распределению управления для линейной стохастической системы с квадратичным функционалом. Автоматика и телемеханика, 1997, т.58, в. З, с. 106−115
И. Белкина Т. А., Ротарь В. И. Об оптимальности по вероятности и почти наверное для процессов со свойством связности. I. Случай дискретного времени. Теория вероятностей и ее применения, 2005, т. 50, вып. 1, с. 3−26.
Белкина Т. А., Ротарь В. И. Об оптимальности по вероятности и почти наверное для процессов со свойством связности. II. Случай непрерывного времени. Теория вероятностей и ее применения, 2005, т. 50, вып. 2, с. 209−223.
Квакернаак X., Сиван Р. Линейные оптимальные системы управления. М.: Мир, 1977. 9. Касимов Ю. Ф. Введение в актуарную математику (страхование жизни и пенсионных схем). — М.: Анкил, 2001
Конюхова (Белкина) Т. А. Асимптотически оптимальные по вероятности управления в задаче о линейном регуляторе с переменными параметрами. Автоматика и телемеханика, 1994, т.55, в. 2, с. 110−120.
Конюхова (Белкина) Т. А., Ротарь В. И. Управления, асимптотически оптимальные по вероятности и почти наверное в задаче о линейном регуляторе. Автоматика и телемеханика, 1992, в. 6, с. 65−78.
Мельников А.В., Волков С. Н., Нечаев МЛ. Математика финансовых обязательств. М.: ГУ ВЭШ, 2001
Пресман Э.Л. Оптимальность почти наверное и по вероятности для стохастического линейно-квадратического регулятора. Теория вероятностей и ее применения, 1997, т.42, в.2, с.627−632
Ротарь В.И. Некоторые замечания об асимптотической оптимальности.- Исследования по вероятностным проблемам управления экономическими процессами. М.:ЦЭМИ РАН, 1986, с. 93−116. 15. Ширяев А. Н. Вероятность М: Наука, 198 919 202 122 23 [24 [2526

Заполнить форму текущей работой