Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения
Общая задача обработки изображений распадается в связи с её широким применением на весьма широкий класс задач. Одной из таких задач является задача распознавания текста. За последние 10 лет достигнут существенный прогресс в распознавании стандартизированного (машинописного) текста. Разработаны технологии и программные продукты, позволяющие достаточно уверенно (с высокой степенью точности… Читать ещё >
Содержание
- Глава 1. Обзор существующих методов распознавания
- Глава 2. Предварительная обработка изображения
- 2. 1. Пороговая классификация
- 2. 2. Бинарная морфология в предварительной обработке изображения
- 2. 3. Построение скелета изображения
- 2. 4. Обработка «скелета» изображения
- 2. 5. Выделение границ объектов. Способы задания границ
- Глава 3. Распознавание простейших объектов на изображении
- 3. 1. Преобразование Радона
- 3. 2. Поиск прямых на изображении.54 j
- 3. 3. Нахождение параметров окружностей на основе обобщённого преобразования
- Радона
- 3. 4. Метод инверсий для обнаружения окружностей
- 3. 5. Моделирование символов примитивами
- Глава. Распознавание сложных объектов
- 4. 1. Метод алгебраических кривых
- 4. 2. Моделирование рукописных символов алгебраическими кривыми
- 4. 3. Инвариантные дескрипторы Фурье
- 4. 4. Представление плоской кривой эллиптическими дескрипторами Фурье
- 4. 5. Функция длины хорды для построения характерных признаков объекта
- 4. 6. Признаки распознавания объекта
- Глава 5. Сегментация изображения
- 5. 1. Диаграммы Вороного. v
- 5. 2. Сегментация текста на основе обобщённых диаграмм Вороного .Л
- 5. 3. Алгоритм обнаружения угла наклона текста
- 5. 4. Алгоритм сегментации простых арифметических выражений
- 5. 5. Алгоритм деления текста на строки и слова
- Глава 6. Программная оболочка распознавания рукописных и печатных текстов
- 6. 1. Блок предварительной обработки изображения
- 6. 2. Блок сегментации текста
- 6. 3. Блок распознавания символов
- 6. 4. Блок окончательной обработки результатов распознавания
Разработка алгоритмов распознавания рукописных символов на основе аналитических свойств изображения (реферат, курсовая, диплом, контрольная)
Актуальность исследования.
Цифровая обработка изображений является современным разделом IT-технологий по ряду причин, связанных как с фундаментальными и научными исследованиями, так и с непрерывно растущим спектром её практических приложений. Хорошо известными примерами возникновения такой задачи в сфере фундаментальной науки являются астрономия, физика элементарных частиц, фотография. Соответствующее практическое, технологическое применение данная задача нашла в радиолокации, медицине, географии, в широком спектре задач учёта и систематизации данных и информации и т. п. Можно с уверенностью констатировать, что развитие средств вычислительной, техники привело к состоянию, когда цифровая обработка изображений проникла во все области человеческой деятельности.
Общая задача обработки изображений распадается в связи с её широким применением на весьма широкий класс задач. Одной из таких задач является задача распознавания текста. За последние 10 лет достигнут существенный прогресс в распознавании стандартизированного (машинописного) текста. Разработаны технологии и программные продукты, позволяющие достаточно уверенно (с высокой степенью точности) распознавать машинописный текст., наиболее известными из которых являются ABBYY FineReader OCR [1], OmniPage [2], Readlris [3], CuneiForm [4]. Иначе обстоит дело с методами, технологиями и программными комплексами для распознавания рукописного текста. Так, существующие программные продукты (например, ABBYY FormReader [5]) предназначены, в основном, для ввода специальных форм или анкет, заполненных от руки.
Рукописный текст является наиболее естественным для человека способом сохранения и дальнейшего использования информации. С использованием вычислительной техники, глобальных сетей и средств обмена сообщениями роль рукописного текста в повседневной коммуникации является значительной. Простейшими примерами являются почтовые адреса на конвертах, школьные задания, медицинские справки и заключения, заполненные от руки анкеты и формы, подписи на документах и банковских чеках, человеческое общение посредством письма — лишь малая часть современных примеров использования рукописных текстов. Однако перевод рукописных документов в электронную форму путём набора текста оператором с бумажного носителя сложен и подразумевает использование значительных человеческих ресурсов.
В настоящее время достаточно сложно оценить общее количество существующих рукописных документов, которые уже сейчас необходимо перевести в цифровой формат и распознать. Например, на начало 2009 года в Государственном архиве Российской Федерации насчитывалось более 1 миллиона дел по истории Российской империи и истории России только периода Временного правительства. При этом подавляющей частью документов являются именно письменные источники [6]. Кроме архивов существует современная активная деятельность человека, производящая чрезвычайно большой объём рукописной информации, подлежащей обработке, хранению и систематизации. По этой причине существует реальная потребность в создании автоматизированных систем распознавания рукописных документов, не требующих больших трудозатрат со стороны оператора.
Кроме того, в ряде случаев рукописный ввод представляет собой более удобный способ передачи информации между человеком и компьютером. Так, некоторые системы распознавания рукописного ввода нашли широкое применение в мобильных устройствах, в том числе, карманных персональных и планшетных компьютерах, где применение клавиатуры нецелесообразно с точки зрения эргономики или размеров устройств.
Весь спектр перечисленных проблем и масса новых технологических задач определяют актуальность исследования и разработку методов обработки именно рукописных текстов.
Цели и задачи диссертации.
Письменный текст — это графическая знаковая система представления информации. В качестве графических знаков в алфавитных системах письма используются буквы, цифры, специальные знаки, в неалфавитных — слоговые знаки, иероглифы и др. [7]. Можно ввести условное деление письменных текстов по способу их создания на два типа: рукописный и машинописный. В этом случае возникают следующие различия между соответствующими типами символов и знаков текста.
1. Машинописный текст обладает свойством стандартизации. Графическое изображение символа текста фиксированного размера, принадлежащее некоторому шрифту, может быть «напечатано» без значительных искажений произвольное число раз. В свою очередь, ввиду физиологических особенностей процесса написания текста, Рукописный текст не стандартизован, подвергается определённым искажениям, существенно индивидуален, не является тождественным предыдущему.
2. В машинописном тексте символы отделены друг от друга некоторым технологическим интервалом. В рукописных же текстах преимущественно имеет место слитное написание отдельных символов при изображении слова.
3. Геометрическое расположение знаков1 печатного текста представляет собой фиксированную структуру с набором «параллельных» строк или столбцов символов. Рукописный текст чаще хаотичен, чем структурирован.
Учитывая изложенные выше отличия между рукописным и машинописным текстом,, можно сделать вывод о — существенно большей сложности решения задачи распознавания рукописных текстов по сравнению с печатными текстами. Проблемами в этом случае являются сложность применения фиксированного набора шаблонов для распознавания рукописных символов, неоднозначность выделения букв в слове, а также сложность выделения логической структуры текста (строк, абзацев и т. п.).
Цели и задачи исследования.
Так как задача распознавания рукописного текста до настоящего времени не решена, целью диссертационного исследования является разработка и теоретическое обоснование алгоритмов, предназначенных для распознавания рукописных текстов на основе развития методов распознавания печатных текстов и развитие новых алгоритмов решения такой задачи. Для достижения поставленной цели в диссертации решаются следующие задачи.
1. Разработка общей схемы распознавания рукописных и машинописных текстов на изображении.
2. Анализ методов обработки изображения, полученного оптическим сканированием.
3. Развитие и разработка методов распознавания изображения простейших геометрических объектов (прямых, окружностей и, т.п.).
4. Развитие методов распознавания рукописных символов и текстов на основе обобщения и интегрирования методов, развитых для машинописных текстов и символов.
5. Разработка теоретических основ и алгоритмов сегментации рукописных текстов.
6. Создание программной оболочки распознавания рукописных и печатных текстов.
Методы исследования.
Выполненные теоретические и экспериментальные исследования основаны на использовании теории^ интегральных преобразований, теории вероятностей и математической статистики, методов вычислительной геометрии, теории множеств, теории размерности, теории кривых, обобщённых функций.
Научная новизна и значимость работы.
Научная новизна работы заключается в разработке алгоритмов и и программного комплекса для распознавания рукописных текстов. 1 В работе впервые разработаны:
1.1 алгоритмы распознавания прямых и окружностей без использования пространства «аккумулятора» для хранения параметров двойственного исходному изображению;
1.2 быстрый алгоритм поиска окружностей на изображении на основе метода инверсий;
1.3 алгоритм моделирования и распознавания рукописных символов алгебраическими кривыми;
1.4 алгоритм выделения и классификации алгебраических кривых на изображении;
1.5 алгоритм распознавания рукописных и печатных символов на основе дескрипторов функций длины хорды.
1.6 алгоритм сегментации рукописных и печатных текстов на основе анализа диаграмм Вороного;
1.7 алгоритм определения угла наклона рукописных и печатных текстов на основе анализа диаграмм Вороного.
2 Для разработанных алгоритмов приведены теоретические обоснования.
3 Доказана лемма о структуре обобщённой диаграммы Вороного.
4 Разработанные алгоритмы объединены в пакет прикладных программ для распознавания рукописных и печатных текстов.
Практическая ценность работы заключается в разработанном пакете прикладных программ для распознавания рукописных и печатных текстов. Результаты работы могут быть применены в программно-аппаратных комплексах распознавания текстов на оптически сканированных изображениях, в том числе, для автоматизированного распознавания архивных документов и индивидуальных пакетов рукописного ввода информации.
Получены свидетельства об официальной регистрации программ: «распознавание примитивов на изображении» [8], «определение параметров центральных кривых второго порядка на изображении» [9].
Публикации.
— По. результатам проведённых исследований ипрактических разработок опубликовано 10 работ.
Апробация работы.
Результаты исследований докладывались на: УП-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 8−9 февраля 2007 г.), УШ-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 7−8 февраля 2008 г.), ХУ1-Й Международной конференции «Математика. Компьютер. Образование — 2009» (г. Пущино, 1924 января 2009), ЕХ-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 12−13 февраля 2009 г.), Х-й Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (г. Воронеж, 11−12 февраля 2010 г.).
Личный вклад автора.
Все основные работы, выносимые на защиту, получены автором самостоятельно.
Структура и объём диссертации.
Основное содержание работы изложено в шести главах. Работа содержит 153 страницы машинописного текста, 58 рисунков и 4 таблицы. Список цитируемой литературы включает в себя 92 наименования.
В главе 1 проведён анализ существующих методов распознавания рукописных и машинописных текстов являющихся частным случаем общей проблемы цифровой обработки изображений. Представлена классификация методов распознавания рукописного ввода, выделены online, offline и комбинированные методы распознавания. Результаты, полученные в диссертационной работе, отнесены к классу методов offline-распознавания текстовой информации. Сформулирована общая схема разрабатываемой системы распознавания рукописных текстов.
В главе 2 описаны методы подготовки обработки изображений, полученных оптическим сканированием, которые включают в себя пороговую классификацию, удаление шумов на изображении методами бинарной морфологии, способы выделения и кодирования границ распознаваемых объектов, а также получение и обработку «скелета» изображения.
Вглаве- - 3 развиты методы распознавания простейшихобъектов (примитивов) на изображении: прямых и окружностей на основе интегрального преобразования Радона. На основе алгоритмов распознавания примитивов на изображении в настоящей работе разработаны алгоритмы, обладающие меньшими требованиями к используемой памяти при сохранении производительности распознавания. На основе метода инверсий развит новый быстрый алгоритм распознавания окружностей на изображении.
В главе 4 развиты методы распознавания сложных объектов на изображении, включая рукописные символы русского языка. Предложены новые алгоритмы моделирования и распознавания рукописных символов русского языка на основе метода приближения границ объектов алгебраическими кривыми. На основе методов представления замкнутой границы объекта векторами признаков, инвариантными к аффинным преобразованиям изображения, разработаны алгоритмы представления и распознавания рукописных и печатных символов. Предложено использование методы^ главных компонент и дискриминантного анализа для уменьшения размерности вектора признаков объекта.
В главе 5 разработаны алгоритмы выделения строк, слов и символов рукописных и печатных текстов, использующие диаграмму Вороного. Развит новый алгоритм определения угла наклона рукописных и печатных текстов. Доказана лемма о связи точечной и обобщённой диаграмм Вороного.
В главе 6 описан интерфейс и внутренняя структура программной оболочки для распознавания рукописных и печатных текстов. Разработан алгоритм проверки и коррекции результатов распознавания по словарю.
Положёния, выносимые на защиту.
1. Разработаны теоретические основы алгоритмов распознавания прямых и окружностей без использования пространства «аккумулятора», двойственного исходному изображению.
2. Разработаны теоретические основы быстрого алгоритма поиска окружностей на изображении методом инверсий.
3. Разработана теория алгоритма и реализован алгоритм моделирования и распознавания рукописных символов алгебраическими кривыми.
4. Реализован алгоритм выделения и классификации алгебраических кривых на изображении.
5. Исследовано прменение дескрипторов функций длины хорды к распознаванию рукописных символов русского языка.
6. Разработан алгоритм сегментации рукописных и печатных текстов на основе анализа диаграмм Вороного.
7. Развита теория и разработан алгоритм определения угла наклона рукописных и печатных текстов на основе анализа диаграмм Вороного.
8. Алгоритмы объединены в пакет программных оболочек.
Выводы.
1. Разработан программный комплекс распознавания машинописных и рукописных текстов, который состоит из следующих функциональных блоков: предварительной обработки изображения, сегментации текста, распознавания символов и окончательной обработки результатов распознавания.
2. В § 6.4 предложен алгоритм коррекции результатов распознавания изображения по словарю на основе оценки величины ошибки распознавания символов слова.
Заключение
.
Распознавание рукописных текстов на изображении представляет собой проблему, требующую решения ряда неоднородных подзадач, в числе которых:
1) предварительная обработка изображения;
2) выделение строк, слов и символов текста;
3) распознавание символов;
5) коррекция результатов распознавания.
Изображение текста, подлежащее распознаванию, как правило, получают путём оптического сканирования некоторого носителя. Результатом данной операции является полутоновое или цветное изображение. Применяемые в настоящей работе алгоритмы распознавания текста используют чёрно-белое изображение, где чёрным цветом кодируются объекты, а белым — фон изображения, что делает необходимым этап предварительной обработки изображения. Для решения данной проблемы используются методы Киттлера и Сауволы пороговой классификации, описанные в разделе § 2.1, позволяющие преобразовать полутоновое изображение в чёрно-белое. Метод локальной пороговой классификации Сауволы неявно использует так называемую «медианную фильтрацию», заключающуюся в усреднении значений ••яркости^' соседних точек, что позволяет устранить с изображения помехи, связанные с дискретизацией сигнала в устройствах оптического сканирования. Чёрно-белое изображение, полученное методом пороговой классификации, может содержать специфические помехи типа «соль-перец», характеризуещиеся появлением изолированных белых или чёрных точек. Устранение шума «соль-перец» на изображении осуществляется посредством последовательного применения операций бинарной морфологии.
Важным этапом процесса распознавания текста является сегментация, заключающаяся в выделении на изображении отдельных строк, слов и символов текста. В настоящей работе сегментация текста осуществляется на основе анализа диаграммы Вороного центров масс связных компонентов чёрно-белого изображения, соответствующих символам текста. Диаграмма Вороного используется для осуществления быстрого поиска «смежных» символов. Так, сложность алгоритма построения данной диаграммы составляет 0(NlogN), а для произвольного компонента вычислительная сложность алгоритма поиска смежных с ним компонентов — 0(1). В разделе § 5.5 предложен собственный алгоритм сегментации текста, основанный на анализе диаграмм Вороного. Выделение строк, символов и слов текста позволяет решить задачу форматирования результатов распознавания, т. е. добавления переноса строк и пробелов в выходном тексте. Кроме того, информация о структуре слов используется для коррекции результатов распознавания по словарю.
Распознавание символов осуществляется путём анализа их внешних и внутренних замкнутых границ, способы выделения и кодирования которых описаны в разделе § 2.5. Полученные границы символа используются для построения вектора признаков, инвариантных к аффинным преобразованиям. В качестве векторов признаков используются дескрипторы Фурье и дескрипторы функций длины хорды, описание которых дано соответственно в разделах § 4.3 и § 4.4. С целью уменьшения размерности векторов признаков символов и повышения надёжности распознавания текста, в настоящей работе применяются метод главных компонент и метод линейного дискриминантного анализа (раздел § 4.5), позволяющие получить проекцию вектора признаков на пространство меньшей размерности, причём линейный' оператор проектирования задаётся на основе данных обучающего-набора: Применение,^ данных методов позволяет классифицировать символ поиском минимального евклидова расстояния между проекциями вектора признаков распознаваемого символа и проекцией вектора признаков символа из обучающего набора.
Распознанный текст подвергается процедуре коррекции, заключающейся в проверке слов текста по словарю. Так, если распознаваемое слово не найдено в словаре, осуществляется поиск словарного слова той же длины, символы которого обеспечивают минимальное суммарное отклонение от символов распознаваемого слова. Описание метода коррекции результатов распознавания приведено в разделе § 6.4.
На основе описанных выше методов в настоящей работе реализована программная оболочка, предназначенная для распознавания рукописных и печатных символов русского языка. В главе 5 содержится описание интерфейса и программной структуры данной оболочки.
В настоящей работе получены смежные результаты, непосредственно связанные с проблемой распознавания рукописных текстов. Так, раздел § 4.2 содержит описание метода моделирования и распознавания символов русского языка на основе их представления алгебраическими кривыми высоких порядков. В главе 2 исследуются методы распознавания примитивов (прямых и окружностей) на изображении на основе интегральных преобразований Радона и формулируются собственные алгоритмы распознавания примитивов без использования аккумулятора. В разделе § 3.4 получен быстрый алгоритм распознавания окружностей на основе инверсных преобразований пространства изображения.
Потенциальная область применения полученных в настоящей работе алгоритмов и программной оболочки достаточно широка, вследствие применения методов распознавания символов на основе выделения векторов признаков, устойчивых к аффинным преобразованиям изображения, что является шагом вперёд по сравнению с существующими программными продуктам распознавания текстов, использующих методы распознавания на основе шаблонов. Стоит отметить, что на момент написания настоящей работы существует единственная коммерческая система с закрытым кодом распознавания изолированных рукописных символов и печатных текстов на основе выделения признаков — Kadmos OCR/ICR [92].
Положения, выносимые на защиту.
1. Разработаны теоретические основы алгоритмов распознавания прямых и окружностей без использования пространства «аккумулятора», двойственного исходному изображению.
2. Разработаны теоретические основы быстрого алгоритма поиска окружностей на изображении методом инверсий.
3. Разработана теория алгоритма и реализован алгоритм моделирования и распознавания рукописных символов алгебраическими кривыми.
4. Реализован алгоритм выделения и классификации алгебраических кривых на изображении.
5. Исследовано прменение дескрипторов функций длины хорды к распознаванию рукописных символов русского языка.
6. Разработан алгоритм сегментации рукописных и печатных текстов на основе анализа диаграмм Вороного.
7. Развита теория и разработан алгоритм определения угла наклона рукописных и печатных текстов на основе анализа диаграмм Вороного. ч.
8. Алгоритмы объединены в пакет программных оболочек.
Список литературы
- Электронный ресурс. ABBYY FineReader — URL: http://finereader.abbyy.com. Дата обращения: 01.11.2009
- Электронный ресурс. OmniPage OCR Software — URL: http://www.nuance.com/omnipage/. Дата обращения: 01.11.2009
- Электронный ресурс. I.R.I.S. OCR software and Document Management solutions — URL: http://www.irislink.com/ Дата обращения: 01.11.2009
- Электронный ресурс. OCR CuneiForm. Система оптического распознавания текстов. URL: http://www.cuneiform:ru/. Дата обращения: 01.01.2009
- Электронный ресурс. ABBYY FormReader 6.5 Enterprise Edition — URL: http://www.abbyy.ru/formreader/enterprise. Дата обращения: 01.01.2009
- Электронный ресурс. Государственный архив РФ URL: http://garf.ru. Дата обращения: 01.01.2009.
- Дьяконов И. М. Письмо / И. М. Дьяконов // БСЭ. 3-е изд. — М., 1975. -Т. 19.-С. 571−577.
- Распознавание примитивов на изображении: Св-во о государственной регистрации программы для ЭВМ № 2 008 612 938 / А. И. Сорокин, С. А. Запрягаев. М., 2008. — 57 с. — (Заявка № 2 008 611 720- Заявлено 21.04.08- Зарегистрировано 18.06.08).
- Прэтт У. Цифровая обработка изображений : в 2 т. / У. Прэтт. — М.: Мир, 1982.-Т. 1.-312 с.
- Яне Б. Цифровая обработка изображений / Б. Яне. — М.: Техносфера, 2007. 584 с.
- Patent US 1 117 184. Handwriting Recognition User Interface with a Stylus / H. E. Goldberg. US Patent, 1915.
- Plamondon R. Online and off-Line Handwriting Recognition: a Comprehensive Survey / R. Plamondon, S. Srihari // Pattern Analysis and Machine Intelligence, IEEE Transactions. 2000. — Vol. 22, No. 1. — P. 6384.
- Guerfali W. Normalizing And Restoring On-line Handwriting / W. Guerfali, R. Plamondon //Pattern Recognition. 1993.- Vol. 26, No. 3.-P. 419−431.
- Tapia E. Understanding Mathematics: A System for the Recognition of Online Handwritten Mathematical Expressions: Dissertation / E. Tapia. — Berlin, 2004. 109 p.
- Sezgin M. Survey Over Image Thresholding Techniques and Quantitative Performance Evaluation / M. Sezgin, B. Sankur // Journal of Electronic Imaging.-2004.-Vol. 13, No. l.-P. 146−168.
- Shafait F. Efficient Implementation of Local Adaptive Thresholding Techniques Using Integral Images / F. Shafait, D. Keysers, T. Breuel // Proc. SPIE. -2008. Vol. 6815. — P. 10−15.
- Shapiro L. Computer Vision / L. Shapiro, G. Stockman // Filtering and Enchancing Images. Prentice Hall, 2002. — P. 145−205
- Jansen M. Empirical Bayes Approach to-Improve Wavelet.Thresholding.-^ for Image Noise Reduction / M. Jansen, A. Bultheel // Journal of the American Statistical Association. 2001. — Vol. 91, No. 454. — P. 629−639
- Shafait F. Performance Comparison of Six Algorithms for Page Segmentation / F. Shafait, D. Keysers, T. Breuel // 7th IAPR Workshop on Document Analysis Systems. 2006. — Vol. 3872. — P. 368−379.
- Kise K. Segmentation of page images using the area voronoi diagram / K. Kise, A. Sato, M. Iwata // Computer Vision and Image Understanding. — 1998. Vol. 3, No. 70. — P. 370−382.
- Nandini N. Estimation of Skew Angle in Binary Document Images Using Hough Transform / N. Nandini, M. K. Srikanta, G. H. Kumar // PWASET. 2008. — Vol. 32, Issue 2070−3740.
- Duda R. O. Use of the Hough Transformation to Detect Lines and Curves in Pictures / R. O. Duda, P. E. Hart // ACM. 1972. — Vol.15, No.l. — P. 1115.
- Huang C. Word Segmentation of Off-Line Handwritten Documents / C. Huang, S. Srihari // CEDAR. Buffalo, NY (USA), 2008. — 5 p|
- Cole Luke. Visual Object Recognition using Template Matching Robotic / Luke Cole, Austin D., Lance Cole // Systems Lab, RSISE National ICT, Australia, Australian National University. 2004.
- Gavrila D. M. Fast Correlation Matching in Large (Edge) Image Databases / D. M. Gavrila, L. S. Davis // Computer Vision Laboratory Center for Automation Research University of Maryland College Park. 1994.
- Nixon M. Region Descriptors / M. Nixon, A. Aguado // Feature Extraction and Image Processing. Oxford- N.Y., 2002. — P. 278−280.
- Аминов Ю. А. Дифференциальная геометрия и топология кривых / Ю. А. Аминов. -М.: Наука, 1987. 160 с.
- Hu М. К. Visual Pattern Recognition by Moment Invariants / M. K. Hu // IRE Trans. Information Theory. 1962. — P. 179−187.
- Teague M. R. Image Analysis by the General Theory of Moments / M. R. Teague // J. Opt. Soc. Am. 1980. — Vol. 70. — P. 920−930.
- Cosgriff R. L. Identification of Shape / R. L. Cosgriff- Ohio State University Research Foundation. Columbus, Ohio (USA), 1960. — Report 820−11.
- Zahn С. Т. .Fourier Descriptors. for-Plane Closed Curves / С., T- Zahn, R. Z. -Roskies // IEEE Transactions on Computers. 1972. — Vol. C21. — P. 269- ' ' 281.
- Jain A.K. Image Transforms / A. K. Jain // Fundamentals of Digital Image Processing. Upper Saddle River- N.J.: Prentice-Hall, 1989. — P. 132−163.
- Theodoridis S. Feature Generation: Linear Transform / S. Theodoridis, K. Koutroumbas // Pattern Recognition. San-Diego-CA, 2003. — P. 230−239.
- A Hidden Markov Models combination framework for handwriting recognition / T. Artieres, L. Gauthier, P. Gallinari, B. Dorizzi // IJDAR -2002. Vol. 5. — P. 233−243.
- Lallican P. M. From off-line to On-Line Handwriting Recognition / P. M. Lallican, C. Viard-Gaudin, S. Knerr // Proceedings of the Seventh International Workshop on Frontiers in Handwriting Recognition. — Amsterdam, 2000- P. 303−312.
- Kittler J. Minimum Error Thresholding / J. Kittler, J. Illingworth // Pattern Recognition. 1986. — Vol. 19. — P. 41−47.
- Niblack W. An Introduction to Digital Image Processing / W. Niblack. — Prentice Hall.- 1986.-P. 115−116.
- Shapiro L. Computer Vision / L. Shapiro, G. Stockman // Binary Image Analysis. Prentice Hall, 2002. — P. 75−86.
- Ritter G. X. Image Algebra / G. X. Ritter, J. N. Wilson // Handbook of Computer Vision Algorithms in Image Algebra CRC Press, 2001. — P. 450.
- Павлидис Т. Алгоритмы машинной графики и обработки изображений /Т. Павлидис- пер. с англ. — М.: Радио и связь, 1986. 400 с.
- Couprie М. Note on Fifteen 2D Parallel Thinning Algorithms / M. Couprie- Institut Gaspard-Monge. Paris, France, 2006. — Technical Report IGM 2006−01.-21 P.
- Гонсалес, Р.-Цифровая обработка изображении /.Р. Гонсалес, Р. Вудс //. Морфологическая обработка изображений. М., 2006. — С. 747−811.
- Freeman Н. On the encoding of arbitrary geometric configurations / H. Freeman // IRE Trans. Electron. Comput. EC-10. 1961. — P. 260−268.
- Ritter G. X. Image Features and Descriptors / G. X. Ritter, J. N. Wilson // Handbook of Computer Vision Algorithms in Image Algebra. CRC Press, 2001.-P. 278−283.
- Хелгасон С. Преобразование Радона / С. Хелгасон. М.: Мир, 1983 — 152 с.
- Patent US 3 069 654. Method and Means for Recognizing Complex Patterns / P.V.C. Hough. US Patent, 1962.50.3ap P. Теория углового момента :0 пространственных. эффектах в* физике и химии / Р. Зар. М.: Мир, 1993. — 351 с.
- Котляр В. В. Кольцевое преобразование Радона / В. В. Котляр, А. А. Ковалев / Компьютерная оптика. 2003. — Вып. 25. — С. 126−133.
- Баранов В. Г. Кольцевое преобразование Радона / В. Г. Баранов, А. Г. Храмов // Компьютерная оптика. 2002. — Вып. 23. — С. 44−47.
- Ginkel M. A Short Introduction to the Radon and Hough Transforms and How They Relate to Each Other / M. Ginkel, C. L. Hendriks, L. J. Vliet // QI-2004−01.-2004.-llp.
- Toft P. The Radon Transform Theory and Implementation : — PhD Thesis / P. Toft. — Denmark, 1996. — 192 p.
- Ballard D. The Hough Method for Curve Detection / D. Ballard // Computer Vision. -Englewood Cliffs- N.J.: Prentice-Hall.-1982. P. 123−126.
- Tarel J.-P. Covariant Conies Decomposition of Quartics for 2d Object Recognition and Affine Alignment / J.-P. Tarel, W. F. Wolovich, D. B. Cooper // ICIP'98. Chicago, 1998. — P. 818−822.
- Lei Z. 3L Fitting of Higher Degree Implicit Polynomials / Z. Lei, M. M. Blane, D. B. Cooper // Proceeding 3rd IEEE Workshop on Applications of Computer Vision. Sarasota, 1996. — P. 148−153.
- Tasdizen T. Improving the Stability of Algebraic Curves for Applications / T. Tasdizen, J.-P. Tarel, D. B. Cooper // Image Processing: IEEE Transactions. 2000. — Vol. 9, No. 3. — P. 405−416.
- Новейшие методы обработки изображений / А. А. Потапов, А. А. Пахомов, С. А. Никитин, Ю. В. Гуляев // Линия с точки зрения математика. М., 2008. — С. 41−53.
- Doncel V. R. An Optimal Detector Structure for the Fourier Descriptors Domain Watermarking of 2D Vector Graphics / V. R. Doncel, N. Nikolaidis, I. Pitas // IEEE Transactions on Visualization and Computer Graphics. 2007. — Vol. 13, No. 5. — P. 851−863.
- Nixon M. Feature Extraction by Shape Matching / M. Nixon, A. Aguado // Feature Extraction and Image Processing. Oxford- N.Y., 2002. — P. 247 277.
- Широкополосные беспроводные сети передачи информации / В. М Вишневский, А. И. Ляхов, С. Л. Портной, И. В. Шахнович. — М.: Техносфера, 2005. 592 с.
- Wang В. Shape Matching Using Chord-Length Function / В. Wang, С. Shi // IDEAL. 2006. — P. 746−753
- Wang B. A Novel Fourier Descriptor for Shape Retrieval / B. Wang, C. Shi // FSKD. 2006. — P. 822−825
- Прикладная статистика / С. А. Айвазян, В. М. Бухштабер, И. С. Енюков, Л. Д. Мешалкин. М., 1989. — Т. 3: Классификация и снижение размерности. — С. 334−344.
- Lay D. Linear Algebra and Its Applications / D. Lay. 3rd Updated Edition. — Redwood, 2005. — P. 426−445.x
- Shlens J. A Tutorial on Principal Component Analysis / J. A. Shlens- Systems Neurobiology Laboratory, Salk Insitute for Biological Studies. -La Jolla, CA (USA), 2007. 13 p.
- Fukunaga K. Introduction to Statistical Pattern Recognition / K. Fukunaga.- San Diego, 1990. P. 445−466.
- Препарата Ф. Вычислительная геометрия: Введение / Ф. Препарата, М. Шеймос. М.: Мир, 1989. — 295 с.
- Fortune S. A Sweepline Algorithm for Voronoi Diagrams / S. Fortune // Proceedings of the Second Annual Symposium on Computational Geometry. Yorktown Heights, N. Y., 1986. — P. 313−322.
- Berg M. Computational Geometry Algorithms and Applications / M. Berg, O. Cheong, M. Kreveld, M. Overmars. 3rd Edition. — Berlin: SpringerVerlag, 2008.-386 p.
- Kise K. On the Application of Voronoi Diagrams to Page Segmentation / K. Kise, M. Iwata., M. Keinosuke // Department of Computer and Systems Sciences, Osaka Prefecture University. Osaka, Japan, 1998. — 4 p.
- Wang Z. Word Extraction Using Area Voronoi Diagram / Z. Wang, Y. Lu, C. Lim С. // CVPRW '03. Madison, 2003. — P. 31−36.
- Сорокин А. И. Определение ориентации текста на основе диаграмм Вороного / А. И. Сорокин // Информатика: проблемы, методология, технологии: материалы X междунар. науч.-метод. конф., Воронеж, 1112 февр. 2010 г. Воронеж, 2010. — Т. 2. — С. 232−236.
- Электронный ресурс. Лебедев А. И. Словарь русского языка для ,. ¦¦ ispell — URL: http://sconl55.phys.msu.su/~swan/orthography.html /. Дата обращения: 01.11.2009
- Электронный ресурс. International Ispell URL: http://fmg-www.cs.ucla.edu/geoff/ispell.html/. Дата обращения: 01.11.2009
- Электронный ресурс. KADMOS ICR / OCR Engine URL: http://fmg-www.cs.ucla.edu/geoff/ispell.html /. Дата обращения: 01.11.2009. -http://rerecognition.com/wwwre/htm/english.htm