Разработка метода направленного перебора альтернатив в задачах классификации объектов на основе теоретико-информационного подхода
Известно, что универсальным способом решения поставленной задачи может служить статистический подход. Его наиболее ярким представителем является группа методов, объединенных общим понятием «скрытых Марковских моделей» (СММ-методы). В качестве альтернативы этим методам могут рассматриваться методы и алгоритмы обработки информации на основе многослойных искусственных нейронных сетей (ИНС). В них… Читать ещё >
Содержание
- Глава 1. Задача распознавания полутоновых изображений
- 1. 1. Статистический подход
- 1. 2. Критерий минимума информационного рассогласования
- 1. 3. Результаты экспериментальных исследований
- 1. 4. Выводы
- Глава 2. Метод направленного перебора альтернатив
- 2. 1. Метрические свойства статистики МИР
- 2. 2. Синтез алгоритма
- 2. 3. Результаты экспериментальных исследований
- 2. 4. Выводы
- Глава 3. Разработка информационной системы
- 3. 1. Архитектура информационной системы
- 3. 2. Интерфейс информационной системы
- 3. 3. Программа и результаты экспериментальных исследований
- 3. 4. Выводы
- Глава 4. Перспективы применения метода направленного перебора в других задачах классификации
- 4. 1. Задача автоматического распознавания речи
- 4. 2. Распознавание изолированных слов методом направленного перебора
- 4. 3. Задача прогнозирования рынка ценных бумаг
- 4. 4. Выводы
Разработка метода направленного перебора альтернатив в задачах классификации объектов на основе теоретико-информационного подхода (реферат, курсовая, диплом, контрольная)
Актуальность темы
исследований. Задача классификации (диагностики, распознавания) [1] как направление исследований и одновременно теоретическая база для решения многих прикладных задач [2] активно развивается с середины XX века. Большой вклад в его развитие внесли отечественные ученые С. А. Айвазян, М. А. Айзерман, М. М. Бонгард, Э. М. Браверманн, В. Н. Вапник, К. В. Воронцов, В. М. Глушков, A.JT. Горелик, Ю. И. Журавлев, Н. Г. Загоруйко, А. Г. Ивахненко, В. А. Ковалевский, Г. С. Лбов, ЛИ. Розоноэр, К. В. Рудаков, В. А. Скрипкин, A.A. Харкевич, Я. З. Цыпкин, А .Я. Червоненкис, М. И. Шлезингер и др. За рубежом одними из основоположников современной теории классификации применительно к распознаванию образов считаются Ф. Розенблатт, предложивший в 1958 г. первую математическую модель деятельности человеческого мозга — персептрон [3]. В дальнейшем их идеи были продолжены и развиты в работах ученых более позднего периода: Ф. Гонсалеса, Р. Дуды, Дж. Ту, К. Фукунаги, К. Фу, П. Харта, Дж. Хопфилда, Б. Уидроу и др.
Среди систем классификации особенно широкое распространение в настоящее время получили системы автоматического распознавания изображений (АРИ) [4]. Это объясняется тем, что информация о многих объектах и явлениях окружающего нас мира регистрируется, хранится и обрабатывается именно в виде изображений. И данное направление исследований сейчас бурно развивается — синхронно с распространением в самых разных сферах человеческой деятельности цифровой вычислительной техники. Цифровые изображения на данный момент являются одним из основных способов представления информации в научных исследованиях, промышленности, медицине, экологии и, конечно же, в экономическом анализе (разного рода диаграммы, таблицы, графики, базы данных и т. п.).
Исюрически первые системы АРИ разрабатывались для читающих автоматов, в которых классифицировались монохромные изображения: буквы и цифры [5]. Здесь обработка изображений сводится к их сегментации на элементарные участки типа отдельных пикселей с последующим сравнением состава одноименных пикселей в анализируемом изображении и в каждом из эталонов-альтернашв из некоторой конечной базы данных. Решение принимается в пользу эталонного изображения по принципу совпадения набора его пикселей с наблюдаемым в анализируемом изображении набором. Проблемы возникают, однако, при распознавании сложных, полутоновых или цветных, изображений, когда не годится сам принцип совпадения пикселей [6]. И связано это, прежде всего, с острейшей проблемой вариативности изображений. Отдельные изображения даже одного и того же объекта могут существенно варьироваться между собой в зависимости от условий его наблюдения: ракурса [7], расстояния или освещения [8]. В указанном случае естественным образом возникает идея группирования анализируемых изображений по принципу их близости друг другу в определенный набор классов, или, говорят, образов. Система АРИ в таком случае решает стандартную задачу классификации изображений на заданном наборе образов [9].
Известно [10, И], что универсальным способом решения поставленной задачи может служить статистический подход. Его наиболее ярким представителем является группа методов, объединенных общим понятием «скрытых Марковских моделей» (СММ-методы) [12, 13]. В качестве альтернативы этим методам могут рассматриваться методы и алгоритмы обработки информации на основе многослойных искусственных нейронных сетей (ИНС) [3, 14, 15, 16]. В них реализуется детерминистский подход к задачам классификации. Ключевой проблемой в этом направлении является проблема «переобучения» ИНС [17, 18]. По сути, данная проблема сводит все направление в тупик: чем больше объем данных для обучения, тем ниже качество работы ИНС. Напротив, в рамках статистического подхода главная проблема — это проблема точности СММ [19]. Особенно актуальной она становится в задачах распознавания изображений из больших множеств альтернатив. Здесь каждому отдельному изображению для обучения (адаптации) СММ требуются десятки и даже сотни независимых образцов. А это, в свою очередь, еще более обостряет проблему вариативности изображений и вслед за ней проблему больших баз эIалойных данных (БЭД) [20].
Естественный способ ее преодоления состоит в радикальной редукции (сжатии) данных [21, 22]. Однако далеко не всегда кластеризация БЭД является эффективным средством решения указанной проблемы. Действительно, в первую очередь проблема больших БЭД обусловлена повышением вариативности образов при увеличении числа эталонов, и, как следствие, резким ростом вероятности ошибки распознавания. А применение более совершенных (и более трудоемких) методов классификации приводит, в свою очередь, к обострению рассматриваемой проблемы. Именно на ее ослабление и нацелена, главным образом, представленная диссертация. И это первый довод в подтверждение актуальности ее темы. Наряду с ним нужно указать на еще один важный, практический аспект.
В последние годы повышенное внимание со стороны исследователей и практиков АРИ уделяется задаче распознавания людей по фотографиям их лиц [23]. С одной стороны, распознавание лиц является одним из наиболее сложных приложений классификации, с другой, сказывается бурный рост спроса на автоматические системы видеоконтроля и видеонаблюдения. Современные информационные технологии видео идентификации людей по их фотографиям признаны наиболее приемлемыми для массового применения [24], так как они не требуют физического контакта объекта (человека) с устройством наблюдения и, в потенциале, характеризуется высокой надежностью ввиду известной уникальности лица каждой отдельной личности. Кроме того, указанный подход выгоден и по той причине, что может использоваться незаметно (без санкции) для окружающих в местах массового скопления людей.
Несмотря на широкую коммерциализацию рынка программных продуктов распознавания (Facelt компании Visionics, TrueFace компании Miros, разработки компания Viisage) и доступность ряда работающих технологий, интенсивность исследований в области АРИ отнюдь не снижается, практические потребности в них только нарастают. Актуальность этого направления подтверждается также продолжающимся ростом числа представительных научно-прикладных конференций таких как ICAFGR (International Conference on Automatic Face and Gesture Recognition) или AVBPA (Audioand Video-based Biomctric Person Authentication), созданием систематических эмпирических тестов для проверки качества распознавания, таких как FERET (Face Recognition Technology) или FRVT (Face Recognition Vendor Test) и др.
К сожалению, уровень надежности существующих систем АРИ пока еще не достаточен [25]. А проблема больших БЭД, которая для идентификации людей стоит наиболее остро, решается либо' еще большим снижением надежности, либо повышением требований к аппаратной среде, в которой эти системы могут работать в режиме реального времени. Как следствие, резко возрастает стоимость таких программно-аппаратных комплексов АРИ. Поэтому разработка алгоритмов, позволяющих сократить объем вычислений АРИ без потери в качестве распознавания, является, на сегодняшний день, наиболее приоритетным в исследованиях по распознаванию образов.
Состояние исследований. Одним из самых первых подходов к решению задачи распознавания образов является способ классификации изображений, основанный на вычислении мер близости между ними [26], основанный на математическом аппарате статистики объектов нечисловой природы [27]. Экспериментальные исследования различных методов распознавания, использующих эту идею, подтверждают ее эффективность. Часто такие эксперименты для задачи АРИ осуществляются в пространстве яркостей отсчетов цифрового изображения [3, 28]. В рамках данного направления наиболее широко используются следующие меры близости: евклидово расстояние, метрика Манхэттена, расстояние Махаланобиса и т. п. Сравнительные исследования показывают [11], что эффективность систем АРИ может существенно и, главное, неконтролируемым образом, варьироваться в зависимости от применяемой меры близости. Более того, указанные различия зависят также от конкретных особенностей задачи (характера искажений, случайной освещенности и др.). Проблемы резко возрастают в условиях больших БЭД. Например, в упомянутой выше задаче идентификации личностей по фотографиям лиц современные базы данных содержат тысячи изображений. Поэтому их полный перебор требует недопустимо больших затрат по времени и, как результат, не может быть реализован в режиме реального времени [29].
Традиционный подход для преодоления указанной проблемы основан на разбиении классов на подклассы (кластеризация) образов [9,.
20] и последующем сохранении в базе данных только наиболее информативных эталонов из каждого кластера. К сожалению, в настоящее время подобное решение на практике зачастую признается неудовлетворительным ввиду недостаточно сильного достигаемого с его помощью аффекта редукции данных. А многочисленные методы, основанные на математическом аппарате деревьев решений [30], оказываются эффективными лишь в тех редких случаях, когда группы однородных изображений в пределах каждого кластера сходны между собой и одновременно резко отличаются от изображений из других кластеров [31].
Поэтому чаще всего на практике ускорение вычислений для больших БЭД производится за счет потерь в качестве АРИ. Например, в работе [32] все изображения на этапе предварительной обработки приводятся к масштабу 4×4 пикселя.
К числу известных способов сокращения вычислительных затрат без существенных потерь в качестве распознавания изображений, помимо отмеченных выше алгоритмов кластеризации, можно указать на устройство мгновенного распознавания изображений [33]. Однако недостатком этого устройства является жесткое ограничение на полноту множества распознаваемых изображений. На практике же распознаваемое изображение, как правило, не дублирует ни один из эталонов. Проблема вычислительной сложности алгоритмов АРИ в этом случае еще более обостряется.
Со всех перечисленных точек зрения несомненный интерес представляет общесистемный принцип минимума информационного рассогласования (МИР) в метрике Кульбака-Лейблера [34], Основанная на этом принципе информационная теория восприятия речи (ИТВР) [35] показала высокие результаты в одном из наиболее актуальных направлений статистической классификации — в задаче автоматического распознавания речи (АРР) [36]. Высокая чувствительность к информационным различиям в сигналах при относительно высокой степени помехозащищенности их обработки и, главное, .радикальное решение проблемы вариативности через строгое определение понятия речевого кластера данных и его информационного центра-эталонадалеко не полный перечень достоинств ИТВР. Между тем, не все преимущества и возможности принципа МИР на данный момент получили необходимое освещение и развитие в научных исследованиях. В частности, до настоящего времени практически не исследовались возможность его применения в задачах АРИ, для которых проблема больших БЭД особенно актуальна. Исследования в этом направлении и составляют главное содержание представленной диссертационной работы.
Объект и предмет исследования. Вычислительные методы классификации изображений и таблиц данных в задачах с большими объёмами баз данных.
Цель диссертационного исследования. Основная цель диссертационной работы состоит в разработке методов ускорения вычислительной процедуры классификации в условиях большого количества альтернатив — на основе принципа минимума информационного рассогласования и предлагаемого метода направленного перебора альтернатив (МНИ). Для достижения этой цели в диссертации решались следующие задачи:
1. Выбор и обоснование теоретико-вероятностной модели изображения.
2. Разработка нового, теоретико-информационного критерия оптимальности решения задачи АРИ на основе теоретико-вероятностной модели изображений;
3. Разработка и исследование нового метода классификации с направленным перебором (МНП) и редукцией БЭД как одной из альтернатив традиционным методам, основанным на принципе полного перебора конкурирующих гипотез;
4. Реализация предложенного вычислительного метода в виде комплекса программ для проведения экспериментальных исследований его эффективности в реальных задачах АРИ с БЭД большого объёма.
5. Исследование возможностей и перспектив применения МНП в других актуальных задачах классификации.
Методы исследования. Для решения поставленных задач в работе использовались современные методы теории распознавания образов, теории вероятностей и математической статистики, математического моделирования, теории информации, теории сигналов, а также информационной теории восприятия речи [35].
Научная новизна работы состоит в следующем.
1. Предложена новая теоре гико-вероятностная модель полутонового изображения с целью применения к задаче распознавания принципа минимума информационного рассогласования в метрике Кульбака-Лейблера.
2. Разработан новый вычислительный метод направленного перебора альтернатив, позволяющий значительно ускорить вычислительную поисковую процедуру классификации по сравнению с традиционными методами «ближайших соседей" — его новизна подтверждена патентом на полезную модель;
3. Разработана модификация метода направленного перебора с обучением в режиме «без учителя», основанная на принципах группирования данных в кластеры по критерию минимума информационного рассогласования, благодаря чему достигается максимальный выигрыш по быстродействию при классификации среди большого количества альтернатив;
4. На основе метода направленного перебора предложен новый алгоритм распознавания речи, позволяющий в несколько раз сократить объем выполняемых вычислений по сравнению с современными методами полного перебора.
Практическая ценность работы состоит в том, что предложенный МНП и его модификации предназначены для решения задач классификации в условиях больших БЭД, когда известные методы характеризуются недостаточным быстродействием. При этом МНП может быть использован как на основе структуры и состава существующих информационных систем, так и путем включения в эти системы вспомогательных (дополнительных) блоков подготовки данных в режиме обучения и их обработки в режиме распознавания. Достигаемый при этом эффект: сокращение объема и времени вычислений оказывается прямо пропорциональным объему БЭД — это главное с точки зрения практики применения качество предложенного МНП.
Результаты диссертационного исследования были использованы в проекте НФ ГУ-ВШЭ № 09−03 от 04.06.2009 «Разработка информационной системы для автоматической группировки и распознавания фотографий лиц методом направленного перебора альтернатив на основе принципа минимума информационного рассогласования» под руководством автора. Разработанная в рамках данного проекта «Автоматизированная система распознавания людей по фотографиям лиц» зарегистрирована в государственном реестре программ для ЭВМ под № 2 009 616 508 — по заявке 2 009 615 314 от 28.09.2009 [37]. Созданная автоматизированная система использована в качестве прототипа при разработке системы биометрической идентификации в отделе исследовательских и перспективных проектов ООО «Теком» (г.Н.Новгород). Результаты диссертационной работы внедрены также в учебный процесс НФ ГУ-ВШЭ по направлению подготовки бакалавров «Бизнес-информатика» (80 700.62).
Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на IX Международной научно-технической конференции «Интеллектуальные системы» в рамках Международного конгресса по интеллектуальным системам и информационным технологиям (Дивноморск, ТТИ ЮФУ,.
2009), на XVI Международной научно-технической конференции «Информационные системы и технологии» (Нижний Новгород, НГТУ,.
2010), на III Всероссийской конференции студентов, аспирантов и молодых ученых «Искусственный интеллект: философия, методология, инновации» (Москва, МИРЭА, 2009), на 14-й Нижегородской сессии молодых ученых по математическим наукам (министерство образования Нижегородской области, 2009), а также на ряде научных семинаров кафедры «Информационные системы и технологии» НФ ГУ-ВШЭ.
Публикации. Основные результаты диссертации опубликованы в одиннадцати работах автора [38−46] в том числе пять — в журналах их Перечня ВАК, а именно: «Автометрия» СО РАН, «Системы управления и информационные технологии», «Вестник Нижегородского университета им. Н.И. Лобачевского» и «Известия вузов России. Радиоэлектроника». Кроме того, автором получен патент на полезную модель «Устройство для распознавания изображений» [47], а также зарегистрирована в Роспатенте программа для ЭВМ «Автоматизированная система распознавания людей по фотографиям лиц» [37].
Основные положения, выносимые на защиту:
1. Метод направленного перебора альтернатив как эффективный вычислительный метод в задаче автоматического распознавания полутоновых изображений;
2. Комплекс проблемно-ориентированных программ для ЭВМ, реализующий метод направленного перебора и предназначенный для проведения вычислительного эксперимента;
3. Оценки вычислительной трудоемкости метода направленного перебора альтернатив в сравнении с генетическим алгоритмом по результатам комплексного исследования проблемы больших баз эталонных данных в задаче автоматического распознавания изображений.
Структура и объем работы. Диссертация включает в себя введение, четыре главы основного текста, заключение, список используемой литературы и приложения. Вся работа изложена на 152 страницах текста, включающих 44 рисунка, 3 таблицы, 6 страниц приложения. Количество библиографических ссылок — 117.
4.4. Выводы.
Таким образом, по результатам проведенного исследования можно сделать вывод об эффективности как принципа МИР, так и разработанного на его основе вычислительного метода направленного перебора альтернатив в разнообразных задачах распознавания образов. Причем, преимущества нового метода по быстродействию во всех рассмотренных случаях увеличиваются при увеличении объема используемых БЭД, а также степени зашумленности их элементов. Поэтому можно со всеми основаниями говорить о существенном ослаблении, а в ряде случаев — о преодолении проблемы больших БЭД благодаря предложенному методу.
Заключение
.
Способ, основанный на вычислении мер близости, является одним из самых наиболее эффективных подходов к решению задачи классификации изображений. При этом качество классификации при применении различных мер близости может существенно различаться в зависимости от конкретных особенностей задачи (характера искажений, I расположения и др.). В связи с этим в последнее время уделяется повышенное внимание возможности применении мер близости, которые в определенных условиях могут дать лучший результат, чем традиционные метрики (Евклида, Манхэттена) [23, 113]. С этой точки зрение исследование эффективности информационной метрики Кульбака-Лейблера [34], проведенное в настоящей работе, представляется весьма перспективным.
Изложенный в диссертации теоретико-информационный подход в задачах АРИ, по-видимому, не имеет серьезных альтернатив ввиду острейшей проблемы вариативности изображений. Однако сама идея статистического (на множестве наблюдений) усреднения изображений в БЭД наталкивается на другую проблему — проблему малых выборок. Естественная с этой точки зрения идея кластеризации изображений по критерию МИР, заимствованная из информационной теории восприятия речи, оказалась не только продуктивной в задачах АРИ и, в целом, — в задачах распознавания образов, но и одновременно послужила своеобразной точкой опоры для разработки нового критерия и метода направленного перебора альтернатив с высокими динамическими характеристиками.
Сама идея введения направления перебора для решения оптимизационных задач в последнее время нашла отражение в особой разновидности генетических алгоритмов — роевой оптимизации [114,.
115]. Но только применение предложенного метода, основанного на априорной информации о рассогласованиях между эталонами из БЭД, позволяет в ряде случаев сократить вычислительную сложность АРИ в 20 раз по сравнению с классическими методами сплошного перебора альтернатив, такими как методы «ближайших соседей» [25]. При этом практически не утрачивается, и это очень важно отметить, и качество результирующего решения [116]. Более того, МНП столь же эффективен в предельных случаях, как и его известные аналоги, такие как деревья решений [79, 117] или система «мгновенного распознавания изображений» [33]. Но, в отличие от них, предложенный метод характеризуется повышением быстродействия и для задач классификации без существенных ограничений на БЭД.
Проведенные исследования наглядно показывают, что МНП может давать хорошие результаты в смысле сокращения перебора альтернатив на основе не только информационной метрики Кульбака-Лейблера, но и существенно более простой в реализации метрики /1. А выражение.
2.2.10) позволяет в таком случае сделать обоснованный выбор в пользу одной из модификаций МНП при учете особенностей каждой конкретной БЭД. Указанная характеристика МНП является определяющей для его применения с различными метриками для конкретных задач АРИ.
Благодаря проведенным исследованиям получены следующие основные результаты:
1. Исследована новая теоретико-вероятностная модель полутонового изображения в задаче классификации среди большого количества альтернативна основе этой модели синтезирован новый алгоритм распознавания изображений по критерию минимума информационного рассогласования в метрике Кульбака-Лейблера.
Доказано, что критерий минимума информационного рассогласования является оптимальным в байесовском смысле для задач классификации дискретных случайных объектов, в том числе, цифровых изображений. Показано, что точность распознавания изображений с варьирующейся освещенностью на основе предложенного критерия существенно выше точности традиционных методов;
2. Исследованы метрические и направленные свойства решающей статистики информационного рассогласования. На их основе разработан новый вычислительный метод направленного перебора альтернатив. Показано, что предложенный метод сокращает перебор множества эталонов не только для метрики Кульбака-Лейблера, но и при использовании традиционных метрик;
3. В условиях натурных испытаний с использованием разработанного комплекса программ исследована эффективность метода направленного перебора в задачах классификации изображений с большими базами данных эталонов. Показано, что применение метода направленного перебора в предложенном двухэтапном алгоритме позволяет на порядок увеличить скорость вычислений по сравнению с известными современными методами «ближайших соседей»;
4. На основе метода направленного перебора разработан алгоритм автоматического распознавания речи по критерию минимума информационного рассогласования. Показано, что этот алгоритм обладает более высокими (в 3−5 раз) динамическими свойствами, чем известные аналоги, реализующие сплошной перебора множества эталонов;
5. Исследована перспектива применения метода направленного перебора для задачи классификации объектов, заданных таблицами данных. На примере классификации состояний фондового рынка показано, что применение предложенного метода позволяет в 3−4 раза ускорить процедуру поиска в ретроспективе состояния, наиболее близкого по динамике к текущему состоянию рынка.
Наосновании полученных результатов сделаны следующие выводы:
1. Предложенная общая теоретико-вероятностная модель изображений вполне оправдала себя как способ преодоления проблемы вариативности образов в задаче АРИ;
2. При прочих равных условиях в задачах статистической классификации объектов нечисловой природы, включая цифровые изображения, применение критерия МИР существенно более обоснованно по сравнению с классическим критерием максимального правдоподобия с точки зрения дополнительных возможностей по гарантии надежности принимаемых решений;
3. Разработанный МНП способен в значительной степени ослабить, а в ряде случаев и преодолеть проблему больших БЭД в задачах распознавания образов;
4. Учитывая распространение графических моделей (таблиц, диаграмм, гистограмм) в современных исследованиях, можно рекомендовать разработанный в диссертации МНП для практического применения в задачах анализа и группирования больших массивов данных, например, при статистической обработке информации социально-экономического характера.
К числу наиболее перспективных направлений применения МНП наряду с рассмотренными задачами автоматического распознавания изображений и автоматического распознавания речи, следует отнести любые задачи, связанные с распознаванием образов из большого множества альтернатив. К задачам' такого рода можно отнести диагностику, медицинскую и техническую, экономический анализ, многоальтернативное прогнозирование динамики рынка ценных бумаг и т. п., а также разработка разнообразных экспертных систем. В принципе, любая таблица числовых данных может естественным образом рассматриваться как некоторое гипотетическое изображение, интенсивность точек которого определяется соответствующими числами в полях имеющейся таблицы. А это, в свою очередь, позволяет естественным образом с успехом применять описанные в диссертации алгоритмы вычисления рассогласований не только для анализа данных из разных источников, но и проводить их нетривиальную визуализацию в процессе анализа, как это делается, например, для объяснения результатов кластеризации с помощью карт Кохонена в задачах экономического анализа. Во всех подобных случаях применение МНП будет способствовать радикальному ослаблению проблемы вычислительной сложности алгоритма при обработке множества альтернатив большого объема, а также повышения точности решения в задачах классификации при обработке нечетких альтернатив.
Список литературы
- Орлов А.И. Математические методы исследования и диагностика материалов //Заводская лаборатория. 2003. — Т.69, № 3. — С.53−64.
- Горелик A. JL, Гуревич И. Б., Скрипкин В. А. Современное состояние проблемы распознавания: некоторые аспекты. М.: Радио и’связь. -1985. -160с.
- Rosenblatt F. The Perceptron: A probabilistic model for information storage and organization in the brain // Psychological Review, 1958. vol. 58. p. 386−408
- Завалишин H.B., Мучник И. Б. Модели зрительного восприятия и алгоритмы анализа изображений. М. Наука. — 1974 г. — 344с
- Харкевич А.А. О принципах построения читающих машин // Радиотехника. 1960. — т.15, № 2.
- Zhao W. Face recognition: A Literature Survey. CS-TR-4167. University of Maryland. Oct. 2000.
- Beymer DJ. Face recognition under varying pose. Technical report 1461. MIT A1 Laboratory. 1993.
- Adini Y, Moses Y, Ullman S Face recognition: the problem of compensating for changes in illumination direction // IEEE Trans Pattern Anal Mach Intcll 19. 1997. p.721−732.
- Аркадьев А. Г., Браверманн Э. M. Обучение машин классификации объектов. М.: Наука. -1974.
- Rabiner L., Juang. B.H. An introduction to hidden Markov models //IEEE ASSP Magazine. 1986. Vol. 3. p.4−16.
- Eickelcr S., Muller S., Rigoll G. High Performance Face Recognition Using Pseudo 2-D Hidden Markov Models // Gerhard-Mercator-University Duisburg, Germany. 1998. — 6 p. -
- Хайкин С. Нейронные сети: полный курс, 2-у изд., испр.: М.:000 «И.Д.Вильяме», — 2006. — 1104 с.
- LeCun Y., Bengio Y. Convolutional networks for images, speech and time series, in M.A.Arbib, ed., The Handbook of Brain Theory and Neural Networks. Cambridge, MA: MIT Press, 1995.
- Уоссермен Ф. Нейрокомпыотерная техника. M.: Мир. — 1992.
- Amari S., Murata N., Muller K.-R., Finke M., Yang H. Statistical theory of overtraining Is cross-validation asymptotically effective // Advances in Neural Information Processing systems. 1996. Vol.8. P.176−182.
- Komanski R., Macukow B. Problems Connected with Application of Neural Networks in Automatic Face Recognition // ICAISC 2004, LNAI 3070. 2004. P.736−741.
- Rabiner L. A tutorial on hidden Markov models // Proceedings of the IEEE. 1989. Vol. 73. P.1349−1387.
- Винцюк, Т. К. Организация вычислений при распознавании больших словарей // Автоматическое распознавание и синтез речевых сигналов: Сб. науч. тр. Киев. 1989.
- Мандель И.Д. Кластерный анализ.-М.: Финансы и статистика. 1988.
- Савченко В.В., Акатьев Д. Ю., Шерстнев С. Н., Метод оптимального обучающего словаря в задаче распознавания речевых сигналов покритерию минимального информационного рассогласования // Известия вузов России. Радиоэлектроника. 2006. — Выи.5. — С. 10−14
- Eickeler S., Jabs М., Rigoll G. Comparison of Confidence Measures for Face Recognition // Gerhard-Mercator-University Duisburg, Germany. 2000. 6 p.
- Козин H.E. Показатели сопряженности и мультиколлинеарносги в задачах анализа и распознавания изображений: Дисс.канд. тех. наук. 05.13.17 / Н. Е. Козин. Самара. 2008.
- Zhao W., Chellappa R. ed. Face Processing: Advanced Modeling and Methods. Elsevier/Academic Press, 2005. 768 p.
- Dasarathy B.V. ed. Nearest Neighbor (NN) Norms: NN Pattern Classification Techniques. Los Alamos, CA: IEEE Computer Society Press, 1991.
- Раушенбах Г. В. Анализ нечисловой информации в социологических исследованиях. М.: Наука. — 1985. — С.169−203.
- Самаль Д., Старовойтов В. Выбор признаков для распознавания на основе статистических данных // Цифровая обработка изображений. -Минск: ИТК, 1999. — С.105−114.
- Хазен Э.М. Методы оптимальных статистических решений и задачи оптимального управления. М. Советское Радиою -1968. — 256 с.
- Breiman L., Friedman J., Olshen R., Stone C. Classification and Regression Trees. New York: Chapman and Hall. 1984
- Фано P.M. Эвристическое обсуждение вероятностного декодирования // Сб. «Теория кодирования». М.:Мир.-1964.-С.166−198.
- Утробин В.А. Информационные модели системы зрительного восприятия для задач компьютерной обработки изображений. Н. Новгород: Изд-во НГТУ. — 2001.
- Патент РФ № 2 004 125 680/09, 10.10.2007. Ченлашкин В. М. Система мгновенного компьютерного распознавания объектов и способ распознавания ./Патент России № 2 308 081. 2007.
- Кульбак С. Теория информации и статистика / Пер. С англ. М.: Наука.-1967.-408 с.
- Савченко В.В. Информационная теория восприятия речи. // Известия вузов России. Радиоэлектроника. 2007. — Вып.6. — С.3−9.
- Галунов В.И., Соловьев А. Н. Современные проблемы распознавания речи // Информационные технологии и вычислительные системы. -2004.-№ 2.
- Савченко А. В. Автоматизированная система распознавания людей по фотографиям лиц Программа для ЭВМ. / Свид-во о гос. регистрации № 2 009 616 508 по заявке 2 009 615 314 от 28.09.2009.
- Савченко A.B. Распознавание изображений методом направленного перебора с применением редукции множества альтернатив // Системы управления и информационные технологии 2009. — Т.37, № 3. — С.40−47.
- Савченко В.В., Савченко A.B. Принцип минимального информационного рассогласования в задаче распознавания дискретных объектов // Известия вузов России. Радиоэлектроника.. 2005. — № 3. -С.10−18.
- Савченко A.B. Распознавание образов методом направленного перебора. // Искусственный интеллект: философия, методология, инновации. Материалы III всероссийской конференции студентов, аспирантов и молодых ученых. М.:Связь-принт". 2009. — С.312−315.
- Савченко A.B. Группирование фотографий лиц методом направленного перебора на основе принципа минимума информационного рассогласования // Тр. XIV Нижегородская сессии молодых ученых. Математические науки. Н.Новгород. 2009 — с. 24−25.
- Савченко A.B. Распознавание образов на основе принципа минимума информационного рассогласования // Тр. XII Всероссийской научно-технической конференции «Нейроинформатика-2010», Сборник научных трудов, часть 2 МИФИ. Москва, янв. 2010. с. 201−207.
- Патент РФ № 2 009 127 049/22, 27.10.2009. Савченко A.B. Устройство для распознавания изображений/Патент России № 88 171. 2009. Бюл. № 30.
- Jain A. Fundamentals of digital image processing. Prentice Hall, Englewood Cliffs. 1989.
- Цыпкин Я.З. Адаптация и обучение в автоматических системах. -М.:Наука. 1968. — 400 с.
- Devroye L., Gyorfi L., Lugosi G. A Probabilistic Theory of Pattern Recognition. Springer. New York. 1996.
- Vapnik V. The Nature of Statistical Learning Theory. Springer-Verlag, New York. 1995. i
- Маамяги A.B. Некоторые задачи статистического анализа классификаций. Таллинн: Изд-во АН ЭССР. — 1982. — 24 с.
- Papoulis A. Probability, Random Variables and Stochastic Processes, 2nd edition. New York: McGraw-Hill. 1984.
- Chien J.-T., Chen J.-C. Recursive bayesian regression modeling and learning // Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing. 2007. Vol. 2. p.557−560.
- Moghaddam В., Jebara Т., Pentland A. Bayesian face recognition // Pattern Recognition. 2000. Vol. 33 (11). p. 1771−1782.
- Rhee P.K., Jeon I., Jeong E.S. Adaptive normalization based highly efficient face recognition under uneven environments // Lecture Notes in Computer Sciencc. 2005. Vol. 3611.
- Moghaddam В., Pentland A. Maximum likelihood detection of faces and hands // International Conference on Automatic Face and Gesture Recognition. 1996.
- Gray R. Entropy and Information Theory. Springer-Verlag. New York. 1990.
- Colmenarez A. J., Huang T. S. Pattern detection with information-based maximum discrimination and error bootstrapping // Proc. Intl. Conf. on Pattern Recognition. 1998.
- Antonio J., Colmenarez T. S., Huang T.S. Face detection with information based maximum discrimination // Proc. Computer Vision and Pattern Recognition. 1997.
- Linsker R. An application of the principle of maximum information preservation to linear systems// Advances in Neural Information Processing Systems. 1989. Vol. 1. p.186−194.
- Toussaint G. On the divergence between two distributions and the probability of misclassification of several decision rules // Proc. 2nd Int. Joint conf on Pattern Recognition. 1974. p.27−34.
- Kullback S., Leibler R.A., On information and sufficiency, Ann. Math. Statist., 1951. Vol.22, p.79−86.
- Акатьев Д.Ю., Савченко В. В. Принцип минимального информационного рассогласования при различении случайных сигналов/ЛРадиоэлектроника. Изв. вузов. 2004. — № 1. — С.12−17.
- Савченко В. В. Различение случайных сигналов в частотной области // Радиотехника и электроника. 1997. — Т.42, № 4. — С.426.
- Боровков А.А. Математическая статистика. Дополнительные главы. -М.: Наука, 1984.-615с.
- Вальд А. Последовательный анализ: Пер. с англ. М.: Физматгиз. -1960.-260 с.
- Duda R. O, Hart P.E. Pattern Classification and Scene Analysis. New York: Wiley. 1966.
- Kohonen, Т. Self Organizing Maps. Springer. Berlin Heidelberg New York. 1995.
- Патент РФ № 99 115 239/09, 10.12.2000. Яхно В. Г., Нуйдель И. В., Тельных A.A., Бондаренко Б. Н., Сборщиков И. Ф., Хилько, А. И. Метод адаптивного распознавания информационных образов и система для его осуществления /Патент России № 2 160 467. 2000. Бюл. № 34. •
- Тельных A.A. Математические модели нейроноподобных сред для разработки систем обнаружения и распознавания объектов заданных классов: Дисс.канд. тех. наук. 05.13.18 / Тельных A.A. -Н. Новгород. 2009.
- Goldberg, D. Genetic Algorithms in search, optimization, and machine learning. Addison-Wesley, 1989.
- Воскобойников Ю.Е., Литвинов Л. А. Выбор момента останова в итерационных алгоритмах восстановления сигналов и изображений // Автометрия. 2004. — № 4. — С. 3−10.
- Джонсон Н., Лион Ф., Статистика и планирование эксперимента в технике и науке: Методы планирования эксперимента. М.: Мир. — 1981. — 520 с.
- Ширяев А. Н. Статистический последовательный анализ. Серия: Оптимизация и исследование операций. М.: Наука. — 1969. — 232 с.
- Савченко В. В. Автоматическое распознавание речи методом дерева на основе информационного (7? +1)-элемента // Известия вузов России. Радиоэлектроника. 2006. — Вып.4. — С. 13−22.
- Савченко В. В. Теория вероятностей и математическая статистика: конспект лекций. Н. Новгород: Нижегородский государственный лингвистический университет им. H.A. Добролюбова. — 2005. — 141 с.
- Марпл, С.Л.-мл. Цифровой спектральный анализ и его приложения. -М.: Мир. 1990.
- Levinson, S.C. Mathematical models for speech technology. // Chichester, England: John Wiley & Sons Ltd. 2005. 261 p.
- Минь H.K., Исследование эффективности адаптивных линейных предсказателей речи для низкоскоростных кодеков: Дис.канд. тех. наук 05.13.17. М., 1997.
- Shonkwiler R. W. Explorations in Monte Carlo methods. Springer, 2009-ISBN 978−0-387−87 949−9.85.http: //www.eclipse.org. (дата обращения: 05.09.2010) :
- Хемраджани А. Гибкая разработка приложений на Java с помощью Spring, Hibernate и Eclipse. М.:Вильямс. — 2008. — 352с.
- Шилдт Г. Полный справочник по Java SE 6. М: Вильямс, — 2008. -1040 с. 88.http: //www.jfree.org/jfrecchart/ (дата обращения: 05.09.2010)
- Acharya. Ray Image Processing: Principles and Applications // Wiley-Interscience, 2005. 428 p.
- Савченко В.В. Автоматическая обработка речи по критерию минимума информационного рассогласования на основе метода обеляющего фильтра // Радиотехника и электроника. 2005. — Т.50(3). -С.309−314.
- Потапова Р.К. Речь: коммуникация, информация, кибернетика: Учебное пособие: Изд. 2-е доп. М.: Эдиториал УРСС. — 2001.
- Widrow В. Adaptive sampled-data systems. A statistical theory of adaptation. WESCON Convention Record, 1959. pt.4.
- Савченко В.В., Акатьев Д. Ю., Карпов Н. В. Автоматическое распознавание элементарных речевых единиц методом обеляющего фильтра. // Известия вузов. Радиоэлектроника. 2007. — Вып.4. — С.11−19.
- Уидроу Б, Стирнз С. Адаптивная обработка сигналов // Пер. с англ. -М.: Радио и связь. 1989. — 440 с.
- Helmholtz H. Die Lehre von der Tonempfindungen als physiologische Graudlage fur die Theorie der Musik, Brounschweig. 1870.
- Goh Z., Tan K.-C., Tan B. Kalman filtering speech enhancement method based on voiced/unvoiced speech model // IEEE Trans. Speech Audio Proces. 1999. Vol.7. P.510−525.
- Gannot S., Burnstein D., Weinstein E. Iterative and sequential Kalman filter-based speech enhancement algorithms // IEEE Trans. Spcech Audio Proces. 1998. Vol.6. P. 373−385.
- Кисляков С.В. Разработка и исследование метода распознавания фонем русского языка на основе аппарата линейного предсказания: Дис.канд. тех. наук 05.12.13. СПб. 2004.
- Кильдишев Г. С. Анализ временных рядов и прогнозирование. Серия: Математическая статистика для экономистов / М.: Статистика, 1973.- 104 с.
- Мерков А.Б. О статистическом обучении. URL: http://www.recognition.mccme.ru/pub/RecognitionLab.html/slt.html (дата обращения: 01.09.2010).
- Ченцов Н. Н. Статистические решающие правила и оптимальные выводы. М.: Наука, 1972.
- Савченко В.В., Акатьев Д. Ю. Теоретико-информационное обоснование метода обеляющего фильтра в задачах автоматическогораспознавания речи. // Системы управления и информационные технологии. 2008. — № 1 (31). — С.21−30.
- Акатьев Д.Ю., Губочкин И. В., Савченко В. В. Автоматическое распознавание изолированных слов методом обеляющего фильтра с сегментированием и амплитудным ограничением сигналов переспросом // Изв. вузов России. Радиоэлектроника. 2007. — Вып. 5. — С.11−18.
- Савченко В.В., Карлов Н. В. Анализ фонетического состава речевого сигнала методом переопределенного дерева. '// Системы управления и информационные технологии. 2008. — Т, 32,№ 2. — С.297−303.
- Bellman R. Dynamic Programming. Princeton, NJ: Princeton University Press, 1957.
- Элдер A.A. Как играть и выигрывать на бирже. М.: Крон-пресс, 1996.
- Швагер Д. Технический анализ: Полный курс Technical Analysis. -М., 2009. -С.804.
- Савченко В.В. Использование линейной авторегрессионной модели для прогнозирования динамики биржевых котировок // Автометрия. 2004. — № 4. — Т.40. — С.117−128.
- Baier D., Decker R., Schmiedt-Thieme L. cd. Data Analysis and Decision Support. Springer-Verlag Berlin Heidelberg New York.
- Шевяков С.Б. Методы анализа текстур на изображении: Дисс.канд. тех. наук. 05.13.17 / С. Б. Шевяков. Н. Новгород. 2002.
- Савченко В.В., Пономарев Д. А. Автоматическая периодизация случайных временных рядов с использованием метода обеляющего фильтра // Автометрия. Т.45, № 1. — 2009. — С.56−64.
- Ebcrhart R., Kennedy J. A New Optimizer Using Particle Swarm Theory // Proc. Int. Sym. Micro Machine and Human Science, Nagoya Japan. 1995. P.39−43.
- Chen C.C. Hierarchical Particle Swarm Optimization for Optimization Problems // Tamkang Journal of Science and Engineering. 2009, Vol.12, № 3. P.289−298.
- Foon N. IT, Jin A.T.B., Ling D. N. C. Face Recognition Using Wavelet Transform and Non-negative Matrix Factorization // Proc. 7th Australian Joint Conference on Artificial Intelligence, Caims. 2004. P.192−202.
- Wilking D., Rofer T. Realtime Object Recognition Using Decision Tree Learning // Robot World Cup VIII, Lecture Notes in artificial Intelligence. 2004. 3276. P.556−563.