Построение логико-вероятностной модели прогнозирования системы разнотипных переменных
Необходимость прогнозирования системы разнотипных переменных и исследование качества метода построения таких моделей обуславливается существованием достаточно широкого круга прикладных задач. В качестве примера можно привести задачу выявления взаимосвязи между характеристиками экологической обстановки и характеристиками здоровья населения региона, в которой необходимо по характеристикам… Читать ещё >
Содержание
- Глава 1. Методы построения решающих функций и способы оценивания их качества
- 1. 1. Описание проблемы
- 1. 2. Введение основных понятий
- 1. 3. Подходы к оцениванию качества решающих функций и качества методов их построения в задачах распознавания образов и регрессионного анализа
- 1. 4. Обзор методов решения задач распознавания и регрессионного анализа
- 1. 5. Методы построения решений в классе логических решающих функций
- 1. 5. 1. Класс логических решающих функций (ЛРФ)
- 1. 5. 2. Алгоритмы распознавания и построения регрессионной функции в классе ЛРФ
- 2. 1. Постан овка задачи
- 2. 2. Оценивание качества порогового метода построения кусочно-постоянных решающих функций в одномерном случае
- 2. 3. Обнаружение значимого подмножества переменных мнк-метода построения линейной регрессионной функции
- 2. 4. Метод выбора значимых переменных в ЛРА, основанный на методе случайного поиска с адаптацией
Построение логико-вероятностной модели прогнозирования системы разнотипных переменных (реферат, курсовая, диплом, контрольная)
Актуальность темы
Одним из важных направлений в области информатики является решение задач построения решающих функций на основе анализа эмпирической информации, заданной в виде таблиц данных, временных рядов и экспертных знаний. Хорошо известны такие задачи как распознавание образов и задачи регрессионного анализа. Методы построения решающих функций с успехом применяются в различных научных исследованиях при решении задач в таких областях, как экология, медицина, социология, археология и т. д. К настоящему времени разработано большое количество методов построения решающих функций, основанных на различных идеях, гипотезах и принципах, но тем не менее работы в данном направлении остаются актуальными. Появляется большое число исследований, использующих нейросети (Anil К. Jain, S. Raudys, А. Н. Горбань и др.), коллективы решающих функций (Ю.И. Журавлев, В. Д. Мазуров, Н. Г. Загоруйко,.
A.В. Лапко и др.), логические решающие функции (А.В. Тимофеев,.
B.И. Донской, R S Michalski, Leo Breiman, Г. С. Лбов и др.), экспертные знания при анализе временных рядов (В.Б Головченко). Однако существующие подходы и методы построения решающих функций в задачах анализа многомерной эмпирической информации ориентированы в основном на случай одной целевой переменной (например, задача распознавания образов, регрессионного анализа). Случай одновременного прогнозирования нескольких переменных рассматривался, например, для количественных переменных в задачах многооткликовой регрессии (N.R. Draper, W.G. Hunter, M.J. Box,.
C.A. Айвазян). Кроме того, существует большое число работ [79,84] в области многомерного статистического анализа, посвященных изучению статистических связей между двумя совокупностями случайных величин. Однако в этом случае, во-первых, не ставится вопрос о прогнозировании и, во-вторых, обе совокупности переменных включают в себя только количественные переменные. Таким образом, задача построения моделей прогнозирования системы разнотипных переменных является актуальной.
При решении задач анализа данных важной в теоретическом и практическом плане является проблема оценивания качества метода построения решающих функций, суть которой заключается в том, чтобы найти взаимосвязь между качеством метода, сложностью распределения, сложностью используемого класса решающих функций и объемом обучающей выборки. В работах данного направления понятие сложности распределения, сложности класса решающих функций формализуется по-разному. Под сложностью распределения может пониматься равенство или неравенство матриц кова-риации для разных классов при нормальном законе распределения, гладкость функций распределения в непараметрических методах, независимость, зависимость между двумя, тремя и т. д. бинарными переменными в ряде Бахадура и т. д. Под сложностью класса решающих функций может пониматься ёмкостная характеристика класса (VC-ёмкость), степень полинома восстанавливаемой зависимости или размерность пространства при фиксированной степени полинома, в классе логических решающих функций — число конечных вершин дерева решений и т. д.
Исследования, проводимые в данном направлении, дают возможность строить наилучшую решающую функцию (модель) предлагаемым методом при ограниченном объеме обучающей выборки с учетом сложности распределения, сложности класса решающих функций. Основные результаты решения этой проблемы получены в области построения решающих функций распознавания. Известными работами в данном направлении являются работы В. Н. Вапника, А .Я. Червоненкиса, Ш. Ю. Раудиса. Этой проблеме посвящен и ряд работ в институте математики СО РАН (Г.С. Лбов, Н. Г. Старцева, В. Б. Бериков, В.М. Неделько). Подход В. Н. Вапника, А .Я. Червоненкиса основан на принципе равномерной сходимости частот к вероятностям. Дж. Хьюджом, А. А. Боровковым, Ш. Ю. Раудисом был использован байесовский подход. Из теоретических исследований следует, что чем более сложные модели используются для построения решений, чем больше переменных и меньше число наблюдений (объем выборки), тем больше вероятность получения «плохого» решения — решения сильно отличающегося от оптимального. Так, например, может оказаться, что квадратичная решающая функция распознавания будет хуже, чем линейная, либо линейная функция, заданная на всем множестве переменных, будет хуже линейной функции, заданной на некотором их подмножестве.
Необходимость прогнозирования системы разнотипных переменных и исследование качества метода построения таких моделей обуславливается существованием достаточно широкого круга прикладных задач. В качестве примера можно привести задачу выявления взаимосвязи между характеристиками экологической обстановки и характеристиками здоровья населения региона, в которой необходимо по характеристикам экологической ситуации предсказать набор (систему) характеристик здоровья населения. В подобного рода задачах, как правило, переменные разнотипные, что значительно усложняет построение решающих функций. Указанную особенность (разнотипность) необходимо учитывать при разработке новых методов прогнозирования. Как показывают теоретические и экспериментальные исследования [60], наиболее подходящим классом функций для анализа разнотипной эмпирической информации является класс логических решающих функций, который и стал основным средством исследований, проводимых автором.
Цель работы заключается в разработке и исследовании качества метода построения логико-вероятностной модели прогнозирования системы разнотипных переменных, в частности, исследование методов построения кусочно-линейных регрессионных функций.
Методы исследований. В работе используется аппарат теории вероятностей, математической статистики, теории статистических решений, линейного регрессионного анализа, распознавания образов.
Научная новизна. В работе впервые получены следующие результаты: • разработан способ оценивания качества метода прогнозирования системы разнотипных переменных (ПСРГТ);
• предложен метод прогнозирования системы разнотипных переменных в классе логических решающих функций;
• получены зависимости, позволяющие определить влияние типа переменной (с упорядоченным и неупорядоченным набором значений) на качество решения при ПСРП в условиях малой выборки;
• получены зависимости качества метода ПСРП от сложности распределения, сложности класса решающих функций и объема выборки;
• для порогового метода построения кусочно-постоянных решающих функций (одномерный случай) при заданном классе распределений получена нижняя оценка его качества в зависимости от сложности класса решающих функций (число областей разбиения) и объема выборки;
• предложен критерий обнаружения значимого подмножества переменных МНК-метода построения линейной регрессионной функции. Практическая ценность результатов работы.
Теоретические исследования и методы, предложенные в данной работе, позволяют решать прикладные задачи выбора значимого подмножества переменных в линейном регрессионном анализе, задачи прогнозирования системы разнотипных переменных, что существенно расширяет круг прикладных задач анализа данных, анализа многомерных временных рядов. Результаты были использованы при решении прикладных задач из области медицины и экологии. Программная реализация разработанных методов является эффективным инструментом в статистической обработке данных и может быть применена в научно-исследовательских работах в области медицины, экологии, гидрологии и других естественнонаучных областях. На защиту выносятся:
Разработка способа оценивания качества метода прогнозирования системы разнотипных переменных.
Метод построения логико-вероятностной модели прогнозирования системы разнотипных переменных, основанный на предложенном критерии, с учетом влияния разнотипности пространства.
Результаты анализа зависимости качества метода ПСРП от сложности распределения, сложности решающих функций, объема выборки.
Результаты оценивания качества порогового метода построения кусочно-постоянных функций в зависимости от сложности класса решающих функций и объема выборки при известном классе распределений.
Критерий обнаружения значимого подмножества переменных МНК-метода построения линейной регрессионной функции.
Апробация работы. Основные положения работы докладывались и обсуждались на Конгрессе по индустриальной и прикладной математике (ИН-ПРИМ-98, Новосибирск) — Всероссийских конференциях «Математические методы распознавания образов» (ММРО-99, 2001, 2003, 2005, Москва) — VI Международной конференции «Современные методы математического моделирования природных и антропогенных катастроф» (2001, Красноярск) — Международной конференции «Искусственный интеллект» (2002, 2004. Алушта) — Международной конференции «Информационные системы и технологии «(IST2002, 2004, Минск) — VII и VIII Международной научной конференции (PRIP-2003, 2005, Минск) — Всероссийской конференции «Математические и информационные технологии в энергетике, экономике, экологии» (2003, Иркутск) — научной немецко-российской школе-семинаре «Распознавание образов и изображений» (2003, Алтай) — Международной конференции «Knowledge-Dialogue-Solution» (KDS'2005, 2006, Bulgaria).
Связь с государственными программами. Работа выполнена в рамках проектов № 98−01−673, 01−01−839, 04−01−858 поддержанных РФФИИнтеграционного проекта СО РАН № 13.10 «Анализ и моделирование экстремальных гидрологических явлений».
Публикации. По теме диссертации автором опубликована 21 работа.
Структура и объем работы. Диссертация объемом 155 страниц состоит из введения, четырех глав, заключения, списка литературы из 92 наименований.
Основные результаты диссертационной работы состоят в следующем:
1. Разработан способ оценивания качества метода прогнозирования системы разнотипных переменных (ПСРП), который включает определение класса стратегий природы и функционала качества решающей функции из заданного класса. Качество метода определялось через математическое ожидание функционала качества по выборкам фиксированного объема. Доказано свойство универсальности класса логической решающей функцией в смысле предложенного критерия при решении рассматриваемой задачи.
2. Предложен MLRP-метод прогнозирования системы разнотипных переменных в классе логических решающих функций (метод построения логико-вероятностной модели), основанный на предложенном критерии качества.
3. Получены зависимости, позволяющие определить влияние типа переменной (с упорядоченным и неупорядоченным набором значений) на качество решения при ПСРП в условиях малой выборки.
4. Проведены исследования зависимости качества предложенного метода ПСРП от сложности распределения, сложности класса решающих функций и объема выборки. Разработан GenLRP-алгоритм генерации стратегии природы с заданными параметрами. Результаты численного моделирования представлены таблично и графически.
5. Для порогового метода построения кусочно-постоянных решающих функций (одномерный случай) при заданном классе распределений получена нижняя оценка его качества в зависимости от сложности класса решающих функций (число областей разбиения) и объема выборки.
6. Предложен критерий обнаружения значимого подмножества переменных МНК-метода построения линейной регрессионной функции.
7. На модельных примерах и прикладных задачах продемонстрирована эффективность предложенных методов. Были рассмотрены три прикладные задачи из области экологии, медицины и гидрологии.
Результаты являются новыми в области анализа многомерной разнотипной информации и несут вклад как в развитие теории, так и в развитие алгоритмической базы компьютерных систем обработки разнотипных данных.
ЗАКЛЮЧЕНИЕ
.
Список литературы
- Barlach F. A linear classifier design approach.// Pattern Recognition, 1991, Vol 24, No.9, pp.871−877.
- Berikov V.B. A priori estimates of recognition quality for discrete features. Pattern Recognition and Image Analysis, 2002, Vol. 12, N 3, pp.235−242.
- Berikov V.B. An approach to the evaluation of the performance of a discrete classifier.// Pattern Recognition Letters, 2002, No 23, pp.227−233.
- Breiman L., Friedman J., Olshen R., Stone C. Classification and Regression Trees.// Wadsworth International, California, 1984.
- Chou P. Optimal partitioning for classification and regression trees.// IEEE Trans. Pattern Anal, and Mach. Intell., 1991, Vol.13, No.4, pp.340−354.
- Fix E., Hodger I.L. Discriminatory analysis, nonparametric discrimination.// USAF Shool of aviation medicine, Randolph field, Tex., Project 21−49−004. Rept.4, Contract AF4−1 (128) 31, 1951.
- Greene W.H. Econometric Analysis, 3rd edition, Prentice-Hall.
- Hyghes G.F. On the mean accuracy of statistical pattern recognizers.// IEEE Trans. Inform theory, 1968, Vol. IT-14, N. l, pp.55−63.
- J. Ross Quinlan. C4.5: Programs for Machine learning. Morgan Kaufmann Publishers 1993.
- Kheri S., Batarekh P. A binary decision algorithm.// Inf. Sci. (USA), 1991, 53, № 3, pp.251−270.
- Lbov G.S., Stupina T.A. Some questions of stability of sampling decision functions.// Pattern Recognition and Image Analysis, Vol 9, 1999, pp.408−415.
- Lbov G.S., Stupina T.A. Application of the multivariate prediction method to time series.// Proceeding of the international conference, 2005 (KDS'2005), Varna (Bulgaria), Vol 2, pp.60−67.
- Lbov G.S., Stupina T.A., Berikov V.B., Vikent’ev A.A. On statistical stability of sample decision function in pattern recognition and prediction.//The 6-th german-russion workshop «Pattern recognition and Image Understanding», Altai, 2003, pp.46−49.
- Lbov G.S., Stupina T.A. Statistical Stability of Sampling Decision Functions in Recognition and Prediction Problems.// «Pattern Recognition and Image Analysis», Vol. 14, No 2'2004, pp 231−236.
- Lbov G.S., Stupina T.A. The influence of type of objective variabe on quality of prediction.// Proceedings of the Sixth International Conference, 2001, Minsk, pp. 250−253.
- Lbov G.S., Stupina T.A. To question of statistical stability of sampling decision function of prediction multidimensional variable.// Proceeding of the seven international conference, 2003 (PRIP'2003), Minsk, Vol 2, c.57−61.
- Lbov G.S., Stupina T.A. Некоторые вопросы устойчивости выборочных решающих функций.// Pattern Recognition and Image Analysis, Vol 9, N 3, 1999, pp 408−415.
- Nedel’ko V. M. Exact estimations of empirical risk bias for discrete feature.// Proc. the 6th Korea-Russia Int. Symp. on Science and Technology (KORUS), University of Ulsan, Republic of Korea, 2003.
- Nedel’ko V. M. On the accuracy of Vapnik-Chervonenlcis Risk estimations in discrete case.// PRIP'2003, Minsk, Proceeding of the seventh international conference, 2003, Vol 2, pp.75−79.
- Nedellco V. M. Estimating a Quality of Decision Function by Empirical Risk.// LNAI 2734. Machine Learning and Data Mining in Pattern Recognition. Third International Conference, MLDM 2003, Leipzig. Proceedings. Springer-Verlag. 2003, pp. 182−187.
- Park Y., Slclansky J. Automated design of linear tree clas-sifier.// Pattern Recognition and Image Analysis, 1993, Vol 3, No 3, pp.248−252.
- Ryszard S. Michalski. Machine Learning and Data Mining.// England, 1998, pp. 432.
- Shlien S. Multiple binary decsion tree classifiers.// Pattern Recognition, 1990, Vol.23, No7, pp.757−763.
- Stupina T.A. The Properties of Risk Function In Heterogeneous Multivariate Prediction.// Proceeding of the 8 international conference, 2005 (PRIP'2005), Minsk, Vol l, pp 80−83.
- Абусев P.A. Несмещенное оценивание плотностей распределений достаточных статистик обратного нормального распределения.// Стаистические метды оценивания и проверки гипотез. Пермь, Изд-во ПТУ, 1995, с.5−13.
- Адлер Ю., Горский В. Предисловие к русскому изданию Н. Дрейпер и Г. Смит, Прикладной регрессионный анализ. Кн.1. М.: Финансы и статистика, 1986.
- Айвазян С.А., Енюков Е. С., Мешалкин И. Д. Прикладная статистика: Классификация и снижение размерности. Москва, Финансы и статистика, 1988, 450с.
- Айвазян С.А., Мхитарян B.C. Прикладная статистика и основы эконометрики. М.: Юнити, 1998.
- Айзерман М.А., Браверманн Э. М., Розоноэр Л. И. Метод потенциальных функций в теории обучения машин. Москва, Наука, 1970, 383 с.
- Андерсон Т. Введение в многомерный статистический анализ.// пер. с англ., под ред. Б. В. Гнеденко, Москва, Физматлит, 1963, 500 с.
- Вайнцвайг М.Н. Алгоритм обучения распознаванию образов.// Алгоритмы обучения распознаванию образов, Москва, 1973, с. 110−115.
- Вапник В.Н. Восстановление зависимостей по эмпирическим данным. Москва: Наука, 1979.
- Вапник В.Н., Червоненкис А. Я. Теория распознавания образов. Москва: Наука, 1970.
- Воронцов К.В. Обзор современных исследований по проблеме качества обучения алгоритмов, www.ccas.ru/frc/paper/voron04twin.pdf.
- Вентцель Е.С. Теория вероятностей. Изд-во: Наука, Москва, 1969.
- Гладун В.П. Эвристический поиск в сложных средах.// Киев, Наукова думка, 1977, 166 с.
- Головченко В.Б. Прогнозирование временных рядов по разнородной информации. Новосибирск: Наука. Сибирская издательская фирма РАН, 1999, 88 с.
- Горбань А.Н., Россиев Д. А. Нейронные сети на персональном компьютере. Изд-во «Наука», Новосибирск, 1996, 276 с.
- Гумбель Э. Статистика экстремальных значений. Мир, Москва, 1965.
- Демиденко Е.З. Линейная и нелинейная регрессия.- М.: Финансы и статистика, 1981.
- Джонсон Дж. Эконометрические методы. М., Статистика, 1980.
- Дискант В.А. Алгоритмы построения правил классификации в структурно-аналитических моделях распознавания.// Математические методы анализа динамических систем. Харьков, 1983, № 7, с. 124−127.
- Донской В.И. Алгоритмы обучения, основанные на построении решающих деревьев.// Журн. вычисл. Математики и математической физики, 1982, Т.22, № 4, с. 963−974.
- Донской В.И., Башта А. И. Дискретные модели принятия решений при неполной информации.//Смферополь, Таврия, 1992, 125 с.
- Дуда Р., Харт П. Распознавание образов и анализ сцен. Москва, Мир, 1976, 559 с.
- Дюкова Е.В. Алгоритмы распознавания типа «Кора»: сложность реализации и метрические свойства.// Распознавание, классификация, прогноз (математические методы и их применение), Москва, Наука, 1989, Вып.2, с. 99−125.
- Живоглядов В.П., Медведев А. В. Непараметрические алгоритмы адаптации.//Фрунзе: ИЛИМ, 1974, 134с.
- Журавлев Ю.И. Непараметрические задачи распознавания образов.// Кибернетика. Москва, 1976, № 6, с.93−103.
- Журавлев Ю.И., Загоруйко Н. Г. Класс коллективно-групповых решающих правил, основанных на дисперсионном критерии компетентности предикторов.// Анализ данных и сигналов, Новосибирск, 1998 (вып. 163), с. 82−90.
- Загоруйко Н.Г. Методы распознавания и их применение. Москва, Сов. Радио, 1972, 206 с.
- Загоруйко Н.Г. Прикладные методы анализа данных и знаний. Новосибирск, ИМ СО РАН, 1999, 270 с.
- Казначеев В.П., Поляков Я. В., Трофимов А. В., Лбов Г. С., Ступина Т. А. и др. Гелиогеофизические факторы среды при принатальном развитии в вероятностей модели прогноза здоровья человека.// Весник МНИКА, выпуск N6, 1999 г., Новосибирск, с.37−43.
- Кендал М., Стьюарт А. Многомерный статистический анализ и временные ряды. Москва, Наука, 1976, 740 с.
- Колмогоров А.Н. Теория информации и теория алгоритмов. М.: Наука, 1987,305 с.
- Колмогоров А.Н., Фомин С. В. Элементы теории функций и функционального анализа. Изд-во: Наука, Москва, 1979.
- Котюков В.И. Многофакторные кусочно-линейные модели. М.: Фин. и стат., 1984, 216 с.
- Крамер Г. Математические методы статистики. Мир, Москва 1975.
- Лапко А.В., Лапко В. А., Ченцов С. В. Непараметрические модели стохастических зависимостей коллективного типа.// Многоуровневые непараметрические системы принятия решений, Новосибирск: Наука, 1997, с.136−141.
- Лбов Г. С. Методы обработки разнотипных экспериментальных данных. Новосибирск, Изд-во «Наука», 1981, 152 с.
- Лбов Г. С. Алгоритмы поиска приближенного значения глобального экстремума функций.// Проблемы случайного поиска, 1980, вып. 8.
- Лбов Г. С., Неделько В. М. Восстановление условного распределения на основе экспериментальных данных.// «Информатика и процессы управления». Межвузовский сборник. КГТУ, Красноярск, 1997, с.54−61.
- Лбов Г. С. О представительности выборки при выборе эффективной системы признаков.// Вычислительные системы, 1966, вып. 22, с.39−58.
- Лбов Г. С., Старцева Н. Г. Логические решающие функции и вопросы статистической устойчивости решений. Новосибирск: Изд-во Ин-та математики, 1999, 212 с.
- Лбов Г. С., Старцева Н. Г. Сложность распределений в задачах классификации.// ДАН, 1994, т. 338, № 5, с.592−594.
- Лбов Г. С., Ступина Т. А. О критерии качества решающей функции при прогнозировании многомерной переменной.// «Искусственный интеллект 2'2002» Труды международной конференции, Алушта, 2002, с. 172−179.
- Лбов Г. С., Ступина Т. А. Построение функции прогноза в многомерном разнотипном пространстве.// Труды I международной конференции «Информационные системы и технологии (18Т'2002)», Минск, 2002, с. 253−257.
- Лбов Г. С., Ступина Т. А. Исследование зависимости критерия качества прогнозирования многомерной переменной от объема выборки и сложности решающей функции.// Труды XI Всероссийской конференции ММРО-03, Москва, 2003, 127−129.
- Лбов Г. С., Ступина Т. А. Исследование эффективности метода прогнозирования многомерной переменной.// Труды международной конференции «Искусственный интеллект-2004», Алушта, 2'2004, с. 117−122.
- Лбов Г. С., Ступина Т. А. О статистической устойчивости решающих функций в задачах распознавания и регрессионного анализа.// ДАН, 1999, том 368, Nl, c.31−34.
- Лбов Г. С., Ступина T.A. Об устойчивости выборочных решающих функций к объему выборки в регрессионном анализе.// Тезисы Третьего Сибирского конгресса по индустриальной и прикладной математике (ИН-ПРИМ-98), сЛ04−105.
- Лбов Г. С., Ступина Т. А. Построение функции прогноза в многомерном разнотипном пространстве.// Труды I международной конференции «Информационные системы и технологии (IST'2002)», Минск, 2002, с.253−254.
- Лисицин Д.В. О критериях выбора структуры многооткликовой регрессионной модели.// Сибирский Журнал Индустриальной математики, 2004, Т.7, № 1(17), с.61−72.
- Магнус Я.Р., Катышев П. К., Пересецкий А. А. Эконометрика. Изд-во «Дело», Москва, 2001, 400 с.
- Мазуров В.Д. Применение методов распознавания образов в оптимальном планировании и управлении.// Труды Ин-та математики и механики АН СССР, Урал.науч.центр, 1974, вып№ 6, с. 58−80.
- Манохин А.Н. Методы распознавания образов, основанные на логических решающих функциях.// Вычислительные системы. Новосибирск, 1976, Вып. 67, с.42−53.
- Миркин Б.Г. Анализ качественных признаков. Москва, Статистика, 1976, 250 с.
- Орлов В.А. Граф-схемы алгоритмов распознавания (с применением к геофизическим задачам). Москва, Наука, 1982, 120 с.
- Раудис Ш. Ю. Влияние объема выборки на качество классификации.// Статистические проблемы управления. Вильнюс, 1976, Вып.18, с.1−185.
- Раудис Ш. Ю. О количестве априорной информации при построении алгоритма классификации.// Изв. АНСССР, Техн. кибернетика, Москва, 1972, № 4, с.168−174.
- Раудис Ш. Ю. Ограниченность выборки в задачах классификации.// Статистические проблемы управления, Вильнюс. Институт математики и кибернетики, 1976. Вып. 18, с. 1−185.
- Ростовцев П.С. Алгоритм построения типологий для больших массивов социально-экономической информации.// Модели агрегирования социально-экономической информации. Сб. Науч. тр.-ИЭ и ОПП СО АН СССР, 1978.
- Старцева Н.Г. Оценка сходимости математического ожидания вероятности ошибки классификации для усредненной стратегии.// Д.А.Н, 1995, т. 341, № 5, с.606−609.
- Ступина Т.А. Задача предсказания многомерной переменной.// Доклады j IX Всероссийской конференции «Математические методы распознаванияобразов». РАН ВЦ, 1999, с.67−69.
- Ступина Т.А. О критерии значимости переменных в линейном регрессионном анализе в условиях малых выборок.// VI Международная конференция «Современные методы математического моделирования природных и антропогенных катастроф», Красноярск, 2001, с.270−274.
- Ступина Т.А. О распределении границы в одномерном случае кусочно-постоянной регрессионной функции.// Труды международной научно-технической конференции «Научные основы высоких технологий"у, (НОВТ-97), с. 170−173.
- Ступина Т.А. О соотношении прозрачности воды и концентрации фитопланктона в Байкале.// Сб. статей «математические проблемы экологии», 1994, с.125−128.
- Ступина Т.А. Оценка смещения функционала качества в задаче прогнозирования многомерной разнотипной переменной.// Доклады Всероссийской конференции «Математические методы распознавания образов (ММРО-12)», Москва, 2005, с.209−212.
- Тимофеев А.В. Оптимальные полиномиальные алгоритмы опознания.// Обнаружение и распознавание. Планирование экспериментов, Москва, 1975, с.5−12.
- Хант Э. Искусственный интеллект. Под ред. B.JI. Стефанюка, Москва, Мир, 1978, 558 с. 1. Y!