Построение логических классификаторов при ограничениях на сложность определяющих их дизъюнктивных нормальных форм
Известно, что сокращенная дизъюнктивная нормальная форма имеет, как правило, экспоненциальный размер относительно множества входных переменных (признаков). Кроме того, множество элементарных конъюнкций ДНФ характеристической функции класса используется в качестве входного множества объектов для дальнейших построений в рамках алгебраического подхода, возникает необходимость построить указанное… Читать ещё >
Содержание
- Задача распознавания
- Цели работы
- Содержание работы
- Глава 1. Классы булевых функций, дизъюнктивных нормальных форм и их свойства
- 1. 1. Определения и обозначения
- 1. 2. Классификация булевых функций
- 1. 3. Сложность реализации функций классов Сп, Ф£, Ф? Л, и Ф?)А
- Глава 2. Нижние оценки сложности
- 2. 1. Метод сетей
- 2. 2. Нижние границы сложности функций классов Сп и
- 2. 3. Нижние границы сложности функций класса А
- Глава 3. Верхние оценки сложности
- 3. 1. Верхние оценки сложности функций классов С71 и
- 3. 2. Верхние оценки сложности функций классов и
Построение логических классификаторов при ограничениях на сложность определяющих их дизъюнктивных нормальных форм (реферат, курсовая, диплом, контрольная)
Сложность представления булевых функций дизъюнктивными нормальными формами (ДНФ) имеет большое значение в различных областях математики. Являясь наиболее интерпретируемым типов управляющих схем, ДНФ играют важную роль в теории сложности, задачах контроля, теории распознавания образов, пропозициональной логике и многих других областях математики [15, 18, 21, 31, 32, 36, 37, 44].
Задача распознавания.
Ключевую роль играет сложность представления булевых функций дизъюнктивными нормальными в алгебраическом подходе к распознаванию образов, предложенном в работах академика РАН Ю. И. Журавлёва и развитому в многочисленных работах его учеников [11, 12, 15, 18, 27, 33]. В этих работах были развиты «прямые методы» построения корректных, то есть точных на прецедентах, алгоритмов классификации путем применения специальных алгебраических операций к базовым (некорректным) распознающим операторам. При этом область применения фундаментальных конструкций и понятий (полноты, регулярности и т. п.), заложенных в рамках алгебраического подхода много шире, чем только задачи анализа данных. Главный технический прием указанного подхода состоит в том, что элементарные классификаторы, используются не как объект оптимизации, а как источник базовых операторов, применение к которым соответствующих корректирующих операций и приводит к построению высококачественного алгоритма (решения).
Построение множества всевозможных элементарных классификаторов, равно как и различных частей этого множества, связано с вычислительными трудностями переборного характера. В связи с этим важно получение эффективных алгоритмов построения наиболее простых множеств элементарных классификаторов обеспечивающих точную классификацию.
Логические алгоритмы распознавания, используемые в качестве базовых, хорошо показали себя на практике при решении задач распознавания с бинарной информацией, и, как правило, могут быть использованы даже при существенно неполной и противоречивой информации. Построение этих алгоритмов основано на выделении элементарных классификаторов в виде частичных описаний объектов, содержащих информацию о различиях классов.
Более точно задачу построения множества элементарных классификаторов можно поставить с использованием языка теории дизъюнктивных нормальных форм (ДНФ). В алгебраическом подходе указанные ДНФ строятся для характеристических функций классов (равных единице на описаниях объектов своего класса и равных нулю на описаниях объектов других классов). Как правило, построение дизъюнктивной нормальной формы характеристической функции класса К производится в два шага. На первом шаге строится ДНФ, которая обращается в ноль только на бинарных описаниях объектов из других классов. Затем из полученной ДНФ удаляются те конъюнкции, которые не обращаются в единицу на описаниях эталонных объектов классов К. На основании полученных формул решается вопрос о принадлежности нового объекта одному из классов. Сокращенной ДНФ характеристической функции класса при этом соответствует множество всевозможных элементарных классификаторов. Таким образом возникает задача построения ДНФ булевой функции с ограниченным, как правило небольшим, числом нулей (числом эталонных объектов).
Известно, что сокращенная дизъюнктивная нормальная форма имеет, как правило, экспоненциальный размер относительно множества входных переменных (признаков). Кроме того, множество элементарных конъюнкций ДНФ характеристической функции класса используется в качестве входного множества объектов для дальнейших построений в рамках алгебраического подхода, возникает необходимость построить указанное множество наиболее простым. В то же время, построение минимальной ДНФ булевой функции в общем случае является сложной переборной задачей, качество аппроксимации которой эффективными алгоритмами также невысоко [34, 35, 43].
Первые эффективные подходы к построению простых ДНФ булевых функций с малым числом нулей указал C.B. Яблонский. Его идеи были развиты в работах Ю. И. Журавлёва. А. Ю. Когана, А. Г. Дьяконова и других исследователей [5, 16, 39]. Предложенные ими эффективные алгоритмы позволяют строить достаточно простые ДНФ для различных классов булевых функций с малым числом нулей. Однако, несмотря на вновь возросший в последнее десятилетие объем публикаций по минимизации функций в классе нормальных форм, вопрос о точных границах их сложности остается открытым.
Цели работы.
Цели настоящей работы следующие.
1. Получение новых и улучшении существующих нижних и верхних оценок минимального числа литералов и конъюнкций в реализации дизъюнктивными нормальными формами булевых функций различных классов от большого числа переменных с ограниченным числом нулей;
2. Оценка сложности комбинаторно-логических классификаторов, основанных на описании характеристических функций классов дизъюнктивными нормальными формами;
3. Оценка качества решения комбинаторно-логическими методами задач классификации с бинарными входными данными и непересекающимися классами.
Содержание работы.
В первой главе приводится обзор предшествующих публикаций по теме диссертации, постановка задачи распознавания образов и ДНФ-реализации булевой функции по матрице нулей. Кроме того вводятся ключевые определения и обозначения используемые в работе.
В первом параграфе первой главы излагается общепринятая терминология теории дизъюнктивных нормальных форм связанных исследованием изложенным в настоящей работе. Помимо этого в параграфе приведен ряд определений и обозначений, активно используемых в диссертации.
Второй параграф первой главы посвящен классификации булевых функций. В рамках параграфа даны описания рассматриваемых классов булевых функций, мотивация к их исследованию, описаны статистические свойства и ключевые определения. Пусть п размерность рассматриваемых далее булевых функций.
Класс состоит из всех булевых функций имеющих к нулейкласс состоит из всех таких функций матрицы нулей которых не имеют равных (с точностью до инверсии), а также не содержат нулевого и единичного столбцов. Класс Сп образуют приведенные функции от максимального числа переменныхкласс составляют функции из не имеющие соседних нулевых точеккласс Ф? А состоит из булевых функций класса Ф£, заданных такими матрицами нулевых точек, минимум из числа единиц и нулей в каждом столбце которых не меньше Л.
В параграфе изложен ряд статистических свойств булевых функций, позволяющий строить по оценкам сложности функций (типичных, экстремальных) одного из классов оценки сложности булевых функций (типичных, экстремальных) в других.
Указанные классы естественным образом возникают при анализе статистических свойств булевых функций с малым числом нулей. В параграфе также даны основные соотношения между данными классами.
В заключительном, третьем параграфе первой главы дается краткий обзор наиболее существенных результатов по минимизации сложности ДНФ булевых функций с малым числом нулей.
Во второй главе предложен метод сетей позволяющий построить высокие нижние оценки для функций классов Сп, Ф&tradeи Ф? Л. Суть предлагаемого метода состоит в выделении подмножеств булева куба небольшой мощность, но покрываемых малым числом конъюнкций.
В первом параграфе второй главы дается ряд вспомогательных утверждений и формулируется основная техническая лемма метода.
Целью второго параграфа второй главы является применение полученных результатов к получению нижней оценки сложности функций классов С11 и Ф£.
В третьем параграфе второй главы метод сетей применяется для построения высоких нижних оценок функций класса Ф^Л. Показано, что метод сетей может эффективно учитывать дополнительную информацию о структуре матрицы нулей булевой функции.
В третьей главе приведены эффективные методы синтеза ДНФ булевых функций различных классов.
Первый параграф третьей главы посвящен построению простых ДНФ функций класса Предложенный подход основан, в определенном смысле, на идеях, предложенных А. Г. Дьяконовым [4, 5].
Второй параграф третьей главы посвящен оценке сложности булевых функций классов и Рассуждения параграфа в целом основаны на применении идеи редукции.
Четвертая глава диссертационной работы посвящена анализу сложности и оценке качества решения комбинаторно-логическими методами задач классификации с бинарными описаниями объектов.
Основные результаты диссертации.
1. Предложен метод сетей, с использованием которого построены наилучшие из известных нижние оценки сложности представления дизъюнктивными нормальными формами ряда важных классов булевых функций.
2. Разработан подход к построению дизъюнктивных нормальных форм булевых функций с использованием последовательностей ортогональных разложений. С помощью указанного подхода получен ряд экстремальных оценок сложности дизъюнктивных нормальных форм булевых функций.
3. Получено обобщение редукционного подхода к построению простых дизъюнктивных нормальных форм. С использованием данного подхода для сложности дизъюнктивных нормальных форм ряда булевых функций доказаны верхние оценки, являющиеся в настоящий момент наилучшими.
Список полученных оценок.
Кратко напомним определения основных рассматриваемых классов булевых функций. Класс состоит из всех булевых функций имеющих к нулейкласс Ф£ состоит из всех таких функций матрицы нулей которых не имеют равных (с точностью до инверсии), а также не содержат нулевого и единичного столбцов. Класс С" образуют приведенные функции от максимального, относительно числа нулей, числа переменныхкласс составляют функции из Ф£ не имеющих соседних нулевых точеккласс класс Ф? Л (Ф?Л) состоит из булевых функций класса Ф?(Ф?), заданных такими матрицами нулевых точек, минимум из числа единиц и нулей в каждом столбце которых не меньше Л.
Всякой полной функции по формуле 1.1 может быть сопоставлена некоторая приведенная функция, полностью определяющая сложность ДНФ реализации исходной.
Рассматриваемые в работе классы связаны следующим рядом асимптотических статистических соотношений.
Почти все булевы функции класса при к = 2 п + ио (1) являются приведенными;
Почти всем правильным булевым функциям от п переменных, которые имеют не более к < 1о§-2 п — 1о§-2 1о§-2 п— нулей, при п —> оо по формуле 1.1 ставится в соответствие полная булева функция (Ю.И. Журавлёв и А. Ю. Коган);
Почти все функции класса Ф1 лежат в классе.
• При m < | — (1 + е) у °2ёт> и к — о (2п) почти все функции классов и Фд содержаться в классе Фд т для произвольного положительного е.
Ниже приведен список основных оценок, полученных с использованием предложенных в диссертации методов (во всех оценках приведен главный член разложения).
1. Почти все функции класса имеют длину не более 2 lo" kn (предыдущая рекордная оценка — fc (lo&2^log2n));
2. Все функции класса при п = 2к~1 — poly (k) имеют ранг асимптотически равный 3п. В том числе функции класса Сп имеют ранг асимптотически равный 3п (предыдущая рекордная нижняя оценка 2? г, а верхняя 477,);
3. Все функции класса7fclm имеют следующее ограничение на ранг.
7 ^ 10 Ъпе (к/2 — m) 1 rank D > —п——г. при е = 2—- ^.
3 3(1 + е)' к 4 ^ 10 13пе 1 1 rank D > —п—. при —←. .
.3 9 + Зе F 4 3.
Используя ранее известные методы, можно построить нижнюю оценку (в общем случае) не более 2п;
Заключение
.
Список литературы
- Вебер К. О различных понятиях минимальности дизъюнктивных нормальных форм. // Проблемы кибернетики. 1979. В. 36. — С. 129−158.
- Гуревич И.Б., Журавлёв Ю. И. Минимизация булевых функций и эффективные алгоритмы распознавания. // Кибернетика. — 1974. № 3. — С. 16−20.
- Дьяконов А.Г. Эффективные формулы вычисления оценок для алгоритмов распо-знавния с произвольными системами опорных можеств. //Ж. Вычисл. Матем. и Ма-тем. Физ. 1999. Т. 39. № 11. — С. 1904−1918.
- Дьяконов А.Г. Реализация одного класса булевых функций с малым числом нулей тупиковыми дизъюнктивными нормальными формами. //Ж. Вычисл. Матем. и Матем. Физ. 2001. Т. 41. № 5. — С. 828−835.
- Дьяконов А.Г. Тестовый подход к реализации дизъюнктивными нормальными формами булевых функций с малым числом нулей. //Ж. Вычисл. Матем. и Матем. Физ. — 2002. Т. 42. № 6. С. 924−928.
- Дьяконов А. Г. Построение дизъюнктивных нормальных форм в задачах распознавания образов с бинарной информацией // Доклады РАН. — 2002. Т. 383. № 6. — С. 747−749.
- Дьяконов А. Г. Построение дизъюнктивных нормальных форм в логических алгоритмах распознавания // Ж. вычисл. матем. и матем. физ. — 2002. Т. 42. № 12. — С. 1899−1907.
- Дьяконов А. Г. Построение ДНФ последовательным перемножением // Ж. вычисл. матем. и матем. физ. 2003. Т. 43. № 10. — С. 1589—1600.
- Дьяконов А.Г. Алгебры над алгоритмами вычисления оценок. // М.: МГУ, 2006.
- Дьяконов А.Г. Алгебра над алгоритмами вычисления оценок: нормировка и деление. // Ж. вычисл. матем. и матем. физ. 2007. Т.47 № 6. — С. 1099−1109.
- Дюкова Е. В. Журавлёв Ю. И., Рудаков К. В. Об алгебро-логическом синтезе корректных процедур распознавания на базе элементарных алгоритмов // Ж. вычисл. матем. и матем. физ. 1996. Т. 36. № 8. — С. 215−223.
- Дюкова Е. В., Журавлёв Ю. И. Дискретный анализ признаковых описаний в задачах распознавания большой размерности // Ж. вычисл. матем. и матем. физ. — 2000. Т. 40. № 8. С. 1264−1278.
- Журавлёв Ю.И. О различных понятиях минимальности дизъюнктивных нормальных форм. // Сибирский математический журнал — 1960. Т. 1 № 4. — С. 608−609.
- Журавлёв Ю.И. Об отделимости подмножеств вершин гг-мерного единичного куба. // Тр МИАН СССР. 1958. Т 51. — С. 143−157
- Журавлёв Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации. // Проблемы кибернетики. —- 1978. В. 33. — С. 5−68.
- Журавлёв Ю.И., Коган А. Ю. Реализация булевых функций с малым числом нулей дизъюнктивными нормальными формами и смежные задачи. //Докл. АН СССР. — 1985. Т. 285. № 4. С. 795−799.
- Журавлев Ю.И., Коган А. Ю. Алгоритм построения дизъюнктивной нормальной формы, эквивалентной произведению левых частей булевых уравнений нельсонов-ского типа //Ж. Вычисл. Матем. и Матем. Физ. — 1986. Т. 26. № 8. — С. 1243−1249.
- Журавлев Ю. И., Рязанов В. В., Сенько О. В «Распознавание». Математические методы. Программная Система. Практические применения. // М.: Фазис, 2006. С. 176.
- Коган А.Ю. О дизъюнктивных нормальных формах булевых функций с малым числом нулей //Ж. Вычисл. Матем. и Матем. Физ — 1987. Т. 27 № 6. — С.924—931.
- Коган А. Ю. О нижних оценках сложности дизъюнктивных нормальных форм булевых функций с малым числом нулей // Ж. вычисл. матем. и матем. физ. 1987. — Т 27 № 12 С 1868—1877.
- Кудрявцев В. В., Андреев А. Е. О сложности алгоритмов. // Фундаментальная и прикладная математика — 2009. Т. 15. В. 3. — С.135−181
- Максимов Ю. В. Корректные алгебры над алгоритмами вычисления оценок в множестве регулярных задач распознавания с непересекающимися классами. // Ж. вычисл. матем. и матем. физ — 2009. Т. 49 № 7 С. 1327−1339.
- Максимов Ю. В. Эффективная реализация логических алгоритмов в задачах классификации с малым числом эталонов // Труды всероссийской конференции ММРО-15. М. «МАКС Пресс», 2011 — С. 77−79.
- Максимов Ю В. Простые дизъюнктивные нормальные формы булевых функций с малым числом нулей // Доклады РАН Серия «Математика». — 2012. Т. 445 № 2 — С 143−145.
- Максимов Ю. В. Нижние оценки сложности реализации дизъюнктивными нормальными формами булевых функций специальных классов. // Труды 9-ой международной конференции «Интеллектуализация обработки информации» — М «МАКС Пресс» 2011 С 75−77
- Максимов Ю В Эффективная реализация некоторых классов булевых функций дизъюнктивными нормальными формами // Труды конференции ИТИС-35 ISBN 978−5-901 158−19−7 2012 — С 105−107http•//www itas2012.ntp.ru/pdf/1 569 607 247.pdf
- Рудаков К В, Чехович Ю В Алгебраический подход к проблеме синтеза обучаемых алгоритмов выделения трендов // Доклады РАН — 2003 Т 388 № 1 — С 33−36
- Соколов Н, А Об оптимальной расшифровке монотонных функций алгебры логики //Ж вычисл матем и матем физ — 1982 Т 22 .V2 — С 449−461
- Трофимов С В Об оптимальном уменьшении числа уравнений в системах нельсо-новского типа//Ж вычисл матем и матем физ — 1986 Т 26 N"10 — С 1552—1558
- Яблонский С В, Лупанов О Б (ред) Дискретная математика и математические вопросы кибернетики // Наука, М 1974
- Яблонский С В Введение в дискретною математику Учебное пособие для вузов, 6-е изд //М Высшая школа, 2010
- Воюь Е, Сгаша Y, Hammer Р L, Ibaraki Т, Kogan, А, Makmo К Logical Analysis of Data Classification with Justification//Annals of Operations Research —2011 Vol 188 Iss 1 P 33−61
- Djukova E, Inyakm A, Peskov N, Sakharov A Combinatorial (Logical) Data Analysis m Pattern Recognition Problems // Partem Recognition and Image Analysis — 2005 Vol 15 A0 1 P 46−48
- Feldman V Hardness of approximate two-level logic minimization and РАС learning with membership queries // Journal of Computer and System Sciences — 2009 Vol 75 Iss 1 P 13−26
- Helleistein L, Raghavan P Exact learning of DNF formulas using DNF hypotheses // J of Computet and System Sciences — 2005 Vol 70 Iss 4 — P 435−470
- Keains M J, Vaziram U An Introduction to Computational Learning Theory // Cambndge MA MIT Press 1994
- Kwck S Learning Intermediate Concepts //Lecture Notes m Computer Sciencc — 2001 Vol 2225 P 151−166
- Miltersen P В, Radhakrishnan J, Wegener I On converting CNF to DNF // Theoretical
- Computer Science. 2005. Vol. 347. Iss. 1−2. — P. 325−335.
- Mubayi D., Turan G., Zhao Y. The DNF exception problem. //Theoretical Computer Sciencc. 2006. Vol. 352. Issues 1−3. — P. 85−96
- Pippenger N. The shortest disjunctive normal form of a random Boolean function // Random Struct. Algorithms. 2003. Vol. 22. Iss. 2. P. 161−186.
- Shannon C. The Symbolic Analysis of Relay and Switching Circuits // Trans. Am. Inst. Electrical Eng. 1938. Vol. 38. — P. 713.
- Raab M., Steger A. Balls into bins — a simple and tight analysis. //Lecture Notes In Computer Science. 1998. Vol. 1518. — P. 159−170.
- Umans C., Hardness of Approximating Eg Minimization Problems. //Foundations of Computer Science, IEEE Annual Symposium on. — 1999. — P. 465−475.
- Wegener I. The Complexity of Boolean Functions. // NY: John Wiley & Sons, Inc. 1987.