Исследование оптимальных планов эксперимента для нелинейных по параметрам регрессионных моделей
В работах В. Б. Меласа (,) был предложен подход, который открывает перспективы значительно более полного исследования таких задач. Этот подход назван функциональным подходом. Его основная идея состоит в исследовании опорных точек оптимальных планов как неявно заданных функций вспомогательных величин. В работах В. Б. Меласа и А. Н. Пепелышева (см. монографию) функциональный подход был развит для… Читать ещё >
Содержание
- Введение
- 1. Основные определения, модели, постановка задачи
- 1. 1. Основные определения
- 1. 2. Основные критерии и методы построения оптимальных планов
- 1. 3. Теоремы эквивалентности
- 1. 4. Исследуемые модели
- 1. 4. 1. Дробно-рациональные модели
- 1. 4. 2. Экспоненциальные модели
- 2. 1. Предпосылки. Общая идея
- 2. 2. Ограничения на решение и модель
- 2. 3. Выбор априорного распределения и параметризация П
- 2. 4. Основная система, исследование аналитичности ее решения
- 2. 5. Численная реализация подхода
- 2. 5. 1. Поиск локально оптимального плана
- 2. 5. 2. Вычисление ?(т, г)
- 2. 5. 3. Оценка коэффициентов ряда
- 2. 6. Доказательство теоремы 2.4
- 3. 1. Модель Михаэлиса — Ментена
- 3. 2. Модель кинетики второго порядка
- 3. 3. Модель в виде алгебраической суммы двух экспонент
- 3. 4. Модель экспоненциального роста
- 4. 1. ^-оптимальные планы
- 4. 1. 1. Модель Михаэлиса — Ментена
- 4. 1. 2. Модель экспоненциального роста
- 4. 2. Исследование байесовских-оптимальных планов
- 4. 3. Сравнение оптимальных планов по критерию е^ для модели Михаэлиса — Ментена
Исследование оптимальных планов эксперимента для нелинейных по параметрам регрессионных моделей (реферат, курсовая, диплом, контрольная)
Одной из важнейших методологий исследования объектов и систем различной природы является построение и анализ регрессионных моделей на основе экспериментальных данных. При этом организация эксперимента играет существенную роль для повышения точности результатов при ограниченных ресурсах. Оптимальная организация эксперимента изучается теорией планирования регрессионных экспериментов, которая интенсивно развивается с середины 60-х годов 20-го века.
Эта теория была инициирована работами Дж. Элвинга, Г. Чернова, Дж. Кифера и Дж. Вольфовица, а в ее развитие значительный вклад внесли российские ученые В. В. Налимов, Г. К. Круг, В. В. Федоров, С. М. Ермаков, М. Б. Малютов, В. П. Козлов, Е. В. Седунов и многие другие. В рамках этой теории весьма полно изучены линейные по параметрам регрессионные модели. Однако во многих экспериментальных исследованиях существенную роль играют нелинейные по параметрам модели. Трудность исследования этих моделей заключается в зависимости асимптотической ковариационной матрицы оценок от истинных значений параметров. Для преодоления этой трудности используются известные в статистике подходы: локально оптимальный, минимаксный и байесовский. Возникающие в этих подходах задали построения оптимальных планов являются весьма сложными экстремальными задачами. До недавнего времени аналитическое решение таких задач оказывалось возможным лишь для простейших моделей с одним или двумя параметрами.
В работах В. Б. Меласа ([29], [5]) был предложен подход, который открывает перспективы значительно более полного исследования таких задач. Этот подход назван функциональным подходом. Его основная идея состоит в исследовании опорных точек оптимальных планов как неявно заданных функций вспомогательных величин. В работах В. Б. Меласа и А. Н. Пепелышева (см. монографию [30]) функциональный подход был развит для построения локально оптимальных и максиминно эффективных планов. Настоящая работа посвящена развитию функционального подхода для байесовских планов и сравнительному исследованию всех основных типов планов (локально оптимальных, максиминно эффективных, байесовских и планов в равноотстоящих точках).
Диссертация посвящена построению и исследованию оптимальных планов эксперимента для нелинейных по параметрам регрессионных моделей.
Планом эксперимента называется дискретная вероятностная мера которая определяется таблицей.
Носитель плана состоит из точек, принадлежащих множеству планирования X) а весовые коэффициенты удовлетворяют условиям > 3 о, Ег. ю>.-=1.
Задача, построения оптимального плана состоит в нахождении экстремума (минимума или максимума) величины ф (м®), (1) где Ф— некоторая заданная функция (критерий оптимальности), М (£) — информационная матрица плана Для нелинейной по параметрам функции регрессии г]{х)в)1 информационная матрица имеет вид то где д.
М) = —/ = 1,. 0 = (01,.30т)г, '.
О*- истинное значение вектора параметров (см. [2]).
В общем случае ?* - решение задачи (1) — зависит от которое априорно не известно. Чтобы преодолеть это противоречие существует несколько подходов: локально-оптимальный, байесовский и максиминный.
План называется локалыю-оптимальным относительно вектора параметров в', если он является решением задачи Ф (М (?, в')) —" эир (см. [3]).
Однако часто локально оптимальный подход оказывается неудовлетворительным, так как оптимальный план для в' может быть неудачным для в*. Для характеристики качества плана вводится понятие эффективности гГт оу (*№Ш Ф (М (?*(9), 0))]'.
Чтобы в результате получить план, который не зависел бы от фиксированных значений параметров и обеспечивал хорошие результаты планироЕ вания при любом в из некоторого заданного множества, исходную задачу заменяют на максиминный или байесовский аналог (см. [32], [30]).
• Максиминный: где О, — некоторый компакт в Кт, априорно задано распределение Р (40), ?*(#) — локально-оптимальный план.
Во введении приведен обзор современного состояния предметной области, сформулированы цели исследования и кратко изложены результаты.
В первой главе дается краткий обзор основных понятий и методов теории оптимального планирования регрессионных экспериментов, описываются модели, рассмотренные в диссертации, проводится обзор литературы.
В первом параграфе этой главы формулируются базовые определения и описываются основные методы построения оптимальных планов.
Во втором параграфе формулируются теоремы эквивалентности для байесовских и максиминных планов, которые являются основным аппаратом проверки оптимальности планов.
В третьем параграфе описываются модели, которые рассмотрены в диссертации:
• Модель Михаэлиса — Ментена:
• Байесовский:
3).
0, х ф, в) =, ^ е [0,с/2], 02 > 0.
На практике такая модель используется, в частности, для описания скорости протекания реакции: в — максимальная скорость протекания реакции, х — концентрация вещества.
• Модель кинетики второго порядка.
Более сложная модель, применяемая в экспериментальной химиимодель кинотики второго порядка:
Ф^) = «Т ^ М2]> > 0.
2 + и%Х + Хл.
• Модель в виде алгебраической суммы двух экспонент: ф, 0) = 0хе-в*х + 02е~в*х, х е [0, оо), вА > вг > 0.
• Модель экспоненциального роста. ф, 0) = Ох + в2е~взХ, х е [0, оо), в3> 0.
Вторая глава посвящена описанию методологии фукнкционального подхода и его обоснованию для I)-критерия.
В первом параграфе даются основные определения и предположения метода.
Во втором параграфе описывается функциональный подход. Основной идеей является изучение вектора опорных точек и весов г оптимального плана £г как неявной функции некоторого вспомогательного параметра г, которая задается уравнением д (т, г) = 0, где д (т, ?) — вектор функция состоящая из частных производных <�р (т, г)^, </?(т, г) — критерий оптимальности. Это уравнение называется основным уравнением.
Для произвольной (скалярной, векторной или матричной) вещественно аналитической функции обозначим.
Ф (о) = Ф (*ь), = п= 1,2,. п к.
Следующая теорема является инструментом обоснования функционального подхода:
Теорема 1 Пусть Н открытое множество Мт1, т? Н, г Е [2:1,22], ?1 < 22 произвольные вещественные числа, а <�р (т, 2) вещественная аналитическая функция на множестве Н х [21,22]. Введем обозначения: д 4 то" 1 1 ъ= д2 го1.
При этих условиях если для некоторой точки (т (о), 2о)? Н х [21,22] выполняется равенство д (ц 0),*)) = О и det К (г (о), 2о) ф 0- то:
I В окрестности существует единственная непрерывная функция т (г) такая, что т (го) = То и д (т (г), 2) = 0. Эта функция является вещественной аналитической в окрестности 2о.
II Имеют место следующие рекуррентные формулы:
Т (п+1) = -[У~1](д{т<�п>^), г)){п+1), 71 = 0,1,., (4) 7 где V = К (т (0), 2ь).
Первая часть этой теоремы есть известная в функциональном анализе теорема о неявном отображении, вторая часть доказана в работе ([30]). Формулы (4) называются основными рекуррентными формулами, они лежат в основе вычисления коэффициентов разложения опорных точек и весов оптимальных планов в ряд Тейлора.
Методология построения оптимальных планов включает в себя выбор класса планов, в котором ищется оптимальный план, выбор семейства априорных вероятностных мер и применение теоремы 1.
Обоснование использования этой теоремы проводится для наиболее важных Ии Ь-критериев оптимальности. Первым рассмотрен И-критерий, который требует максимизации величины.
Решение задач оптимизации (2) и (3) ищется в классе планов с т опорными точками, одна из которых совпадает с границей множества х? а весовые коэффициенты равны между собой где с1 — граничная точка Такие планы называются насыщенными планами. Они представляют интерес, поскольку для многих моделей локально 1)-оптимальные планы имеют такой вид (см. [30]).
Одна из трудностей байесовского подхода состоит в выборе априорной меры. Мы исходим из того, что этот выбор можно рассматривать как эвристический прием, позволяющий построить планы, эффективные для оце.
П •¦¦ тт-1 1 /т. 1 /т 1 /т нивания векторов в, истинное значение которых принадлежит некоторому множеству.
Рассмотрим множество Г2 следующего вида:
П = = Пг© = {& = (&!. ., 9т) т: (1-г)а <вг< а/(1-г), г = 1,., ш}.
Здесь точка с= (с,., стп) т может рассматриваться как приближение вектора 0*, а г как относительная погрешность. В качестве априорного распределения рассмотрим равномерное распределение на Так как Г2(0) = {с}, в качестве начального приближения то при построении разложения используется локально оптимальный план, который находится численно.
В третьем параграфе изучается невырожденность матрицы Якоби основной системы и приводятся условия выполнения теоремы 2.1.1:
• Функция ?/(.т, в) является аналитической на [с/1, 2] х Н, где Н окрестность точки в — с. .
.• В окрестности точки с существует локально оптимальный план вида / П. Тт-1 1 /т. 1 /т 1/гп.
• Функции /г-(ж, 9), г = 1,., т при любом фиксированном 9? О, образуют обобщенную систему Чебышева второго порядка на интервале Х.
В главе 3 исследуются оптимальные планы эксперимента для 1)-критерия.
В первом параграфе рассматривается модель Михаэлиса — Ментена. Доказано, что эта модель удовлетворяет условиям теоремы 2.1.1. Локально оптимальные и максиминные планы для данной модели найдены в явном виде. Поэтому разложения в ряд Тейлора опорных точек строятся для байесовского плана. Далее изучается эффективность построенных планов с помощью численных расчетов.
Во втором параграфе исследуются 1)-оптимальиые планы для модели кинетики второго порядка. Доказывается, что опорные точки байесовских оптимальных планов являются аналитическими функциями параметра и строятся разложения этих функций в ряд Тейлора.
В третьем и четвертом параграфах исследуются аналитические свойства байесовских оптимальных планов для моделей экспоненциального вида. Эффектиновсть методологии демонстрируется сравнением найденных планов с планами в равноостоящих узлах и планами, численно найденными в литературе. Оказывается, что байесовские планы требуют приблизительно в два раза меньше наблюдений для достижения заданной точности, чем планы в равноотстоящих узлах.
В главе 4 на основе функционального подхода исследуются оптимальные планы для ¿—критерия, требующего минимизации величины ЬлЬМ1^, в) и для ¿-/-критерия, требующего максимизации минимального собственного числа информационной матрицы. Эти критерии часто более предпочтительны на практике, чем /^-критерий. Планы, построенные на основе различных критериев, сравниваются по величине дисперсии оценок индивидуальных параметров.
В первом параграфе формулируется теорема эквивалентности, изучается невырожденность матрицы Якоби основного уравнения, формулируются достаточные условия для применения теоремы 1 к изучению ¿-/-оптимальных планов.
Во втором и третьем параграфах рассматриваются модель Михаэлиса — Ментена и модель экспоненциального роста. Проверяются условия выполнения теоремы 1. Обосновывается выбор весовой матрицы Ь. Строятся разложения опорных точек и весов локально-оптимальных, байесовских и максиминных планов в ряд Тейлора. Показывается, что байесовские планы менее чувствительны к изменению г и более эффективны, чем планы в равноотстоящих узлах. Численно оценивается максимальное значение г, при котором насыщенный план, построенный на основе разложения, является оптимальным в классе планов с произвольным числом точек.
В четвертом параграфе изучены Е'-оптимальиые планы для модели Михаэлиса Ментена. Доказана аналитичность опорных точек и весов оптимальных планов как функций величины г и построено их разложение в ряд Тейлора.
В заключении перечислены основные результаты диссертации.
Заключение
.
Сформулируем основные результаты диссертации.
1. Разработана методология построения и исследования байесовских оптимальных планов для нелинейных по параметрам регрессионных экспериментов на основе функционального подхода.
2. Для случаев Пи Ькритериев оптимальности дано строгое математическое обоснование применения методологии для ряда нелинейных по параметрам моделей дробно-рационального и экспоненциального вида. Для этих моделей впервые построены разложения опорных точек и весов байесовских оптимальных планов в ряд Тейлора по величине относительной ошибки в задании параметров.
3. Для модели экспоненциального роста и модели кинетики второго порядка впервые изучены аналитические свойства опорных точек и весов максиминно эффективных планов.
4. Впервые проведено сравнительное исследование эффективности всех основных типов планов для нелинейных по параметрам моделей. Показано, что байесовские планы являются менее чувствительными к изменению параметров и позволяют значительно уменьшить количество экспериментов, необходимое для достижения заданной точности, по сравнению с планами в равноотстоящих точках.
Список литературы
- Ганнинг Р., Росси X. Аналитические функции комплексных переменных. М. 1969. стр. 395.
- Ермаков С.М., Жиглявский A.A. Математическая теория оптимального эксперимента. М., Из-во Наука, 1987.
- Ермаков С.М., Михайлов Г. А. Статистическое моделирование. М., Из-во Наука, 1982.
- Карлин С., Стадден В. Чебышевские системы и их применение в анализе и статистике. М., 1976.
- Мелас В. Б. Общая теория функционального подхода к оптимальному планированию эксперимента. Изд-во СПбГУ, 1999.
- Мел, ас В. В., Пепелышев А. Н. Степенные разложения неявных функций и локально оптимальные планы эксперимента. Статистические модели с приложениями в эконометрике. Под ред. С. М. Ермакова, Ю. Н. Каштанова СП6.:НИХИ С.-Петерб. ун-та, 1999. С. 108−117.
- Мелас В.В., Старосельский Ю. М. О методологии построения и исследования оптимальных планов экспериментов, с. 66−69: сб. трудов XX
- Междунар. науч. конф. В 10 т. Т. 1. Секция 1 / под общ. ред. B.C. Балакирева. Ярославль: Изд-во Яросл. гос. техн. ун-та, 2007.
- Мелас В.Б., Старосельский Ю. М. Исследование максиминно-эффективных планов для модели Михаэлиса Ментена. Вестн. С.Петербург. ун-та, СПб., Изд. СПбГУ, 2007, серия 1, вып. 2, с. 41−50.
- Рао С. Р. Линейные статистические методы и их применения. М., 1968.
- Ст.аросельский Ю. М. Исследование байесовских D— оптимальных планов для дробно-рациональных моделей. Вестн. С.-Петербург, унта, СПб., Изд. СПбГУ, 2008, серия 10, вып. 3, с. 98−105.
- Федоров В.В. Теория оптимального эксперимента. М., Из-во Наука, 1971.
- Atkinson А.С., Doneu A.N., Tobias R.D. Optimal experimental designs, with SAS. New York, Oxford University Press, 2007.
- Веска M., and Urfer W. Statistical aspects of inhalation toxicokinetics. Environmental and Ecological Statistics, 2006. Vol. 3 P. 51−64.
- Beverton R. J. H. and Holt S.J. On the Dynamics of Exploited Fish Populations. Her Majesty’s Stationary Office, London, 1957.
- Box G.E.P. and Lucas H.L. Design of experiments in non-linear situations. Biometrika, 1959. Vol. 46. P. 77−90.
- Chernoff H. Locally optimal designs for estimating parameters. Ann. Math. Statist, 1953. Vol. 24. P. 586−602.
- Crabbe M.J.C., Jordan R.M., Ting H.H., Hoe S.T. Bovine lens aldehyde dehydtogenase: activity and non-linear steady-state kinetics. Experimental eye research, 1986. Vol. 43. P. 177−184.
- Duggleby R.G. Experimental designs for estimating the kinetic parameters for enzymecatalysed reactions. J. Theoret. Biology, 1979. Vol. 81. P. 671 684.
- Dette H., Biedermann S. Robust and efficient designs for the MichaelisMenten model. J. Amer. Stat. Assoc, 2003. Vol. 98. P. 679−686.
- Dette H., Melas V.B., Wong K. Locally D-optimal Designs for Exponential Regression. Statistica Sinica, 2006. Vol. 18 (3) P. 789−804.
- Dette H., Mela, s V., Pepelyshev A. Standardized E—optimal designs for the Michaelis Menten model. Statistica Sinica, 2003. Vol. 13. P. 1147−1163.
- Dette H., Neugebauer H.-M. Bayesian optimal designs for exponential regression models. J. Statist. Plann. Inf, 1997. Vol. 60(2) P. 331−349.
- Dette H., Braess D. On the number of support points of maximin and Bayesian D-optimal designs in nonlinear regression models. Annals of Statistics, 2007. Vol. 35(2). P. 772−792.
- Dette H., Lopez I.M., Rodgriguez I.M., Pepelyshev A. Maximin efficient design of experiment for exponential regression models. J. Statist. Plann. Inf, 2006. Vol. 136. P. 4397−4418.
- Jennrich R.I. Asymptotic properties of non-linear least squares estimators. Ann. Math. Statist, 1969. Vol. 40. P. 633−643.
- Han C. Chaloner K. Bayesian experimental design for non-linear mixed-effect models with applications to HIV dynamics. Biometrics, 2004. Vol. 60. P. 25−33.
- Kiefer J. C. General equivalence theory for optimum designs (approximate theory). Ann. Statist, 1974. Vol. 2. P. 849−879.
- Kiefer J., Wolfowitz J., 1960. The equivalence of two extremum problems. Canad. J. Math, 1960. Vol. 14. P. 363−366.
- Mel as V.B. Optimal designs for exponential regression. Math. Operations forsh. Statist. Ser. Statisics, 1978. Vol .9. P. 45−59.
- Mel as V.B. Functional approach to experimental optimal design. Lecture Notes in Statistics. Vol. 184. Heidelberg. Springer, 2006.
- Melas V.B. and Pepelyshev A.N. On representing maximin efficient designs by Taylor series. Journal of Statistical Planning and Inference, 2007. Vol. 137(8). P. 2689−2702.
- Miiller C.H. Maximin efficient designs for estimating nonlinear aspects in linear models. J. Statist. Plann. Inf, 1995. Vol 44. P. 117−132.
- Murphy E. F., Gilmor S.G. and Crabbe M.J.C. Efficient and accurate experiment design for enzyme kynetics: Bayesiain studies reveal a systematicapproach. Journal of Biochemical and Biophysical Methods, 2003. Vol. 55. P.155−178.
- Pukelsheim F., Rieder S. Efficient rounding of approximate designs. Biometrika, 1992. Vol. 79. P. 763−770.
- Rasch D. Optimum experimental design in nonlinear regression. Comm. Statist. Theory Method, 1990. Vol. 19. P. 4789−4806.
- Silvey S. Optimal design. Monographs on Applied Probability and Statistics. Chapman and Hall, London, New York, 1980.
- Seber G.A.F., Wild C.J. Nonlinear regression. Wiley, New York, 1989.