Модели и алгоритмы распознавания железнодорожной технической документации
Разработанная модель процесса автоматического распознавания символа ТЖД отличается новым алгоритмом выбора параметров построения скелетов для символов специализированной технической документации, основанным на концепциях предварительного определения характеристик границ символа и распространения волновых фронтов от границ области. Предложенный алгоритм распознавания изображения МКСЖА или СКСЖА… Читать ещё >
Содержание
- СПИСОК УСЛОВНЫХ СОКРАЩЕНИЙ И ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
Глава I. Структура изображения листа монтажной железнодорожной документации. Анализ технических средств распознавания документов и теоретических основ алгоритмов обработки изображения чертежей и текстовой информации
1.1 Структура и особенности изображения листа монтажной документации для систем железнодорожной автоматики.
1.2 Пакеты программ технического чтения.
1.3 Алгоритмы предварительной обработки изображения.
1.4 Теоретические основы алгоритмов распознавания.
1.5 Выводы и постановка задачи исследования.
Глава II. Предварительная обработка изображения листа монтажной документации с целью удаления шумов и искажений
2.1 Перевод изображений технических железнодорожных документов в чёрно-белую палитру без применения алгоритмов фильтрации.
2.2 Устранение шумов перед переводом изображения в черно-белый вид.
2.3 Применение преобразования Уолша
2.4 Устранение шумов с помощью вещественного косинус-преобразования и комплексного дискретного преобразования Фурье.
2.5 Удаление помех перед разграничением объекта и фона.
2.6 Влияние качества фильтрации на последующую обработку изображения.
2.7 Выводы.
Глава III. Распознавание таблиц железнодорожной документации.
3.1 Распознавание таблиц при высоком качестве изображения.
3.2 Поиск горизонтальных и вертикальных линий для таблиц, построенных вручную.
3.3 Алгоритм поиска разрывов без наложения для горизонтальных линий.
3.4 Алгоритм поиска разрывов с наложением.
3.5 Распознавание структуры таблицы монтажной документации для систем железнодорожной автоматики.
3.6 Выводы.
Глава IV. Модели процессов распознавания символов и распознавания таблицы монтажной документации для систем железнодорожной автоматики как целостной структуры.
4.1 Особенности задачи распознавания символьной информации, представленной в таблицах ТЖД
4.2 Выделение связных множеств и выдвижение гипотез о принадлежности рассматриваемых множеств к семейству изображений символов как модель процесса автоматической сегментации символов внутри ячеек
4.3 Скелетизация множества
4.4 Граница множества и алгоритм обхода границы.
4.5 Алгоритмы построения скелетного графа символа для изображения высокого качества
4.6 Алгоритм построения скелетного графа символа для изображения невысокого качества
4.7 Построение базы данных скелетных графов эталонных символов для монтажной документации систем железнодорожной автоматики.
4.8 Проверка гипотезы о принадлежности распознаваемой области множеству символом и выбор символа с помощью базы данных скелетных графов эталонных символов.
4.9 Объединение символов, расположенных в ячейках таблицы, в слова и строки. Модель распознавания листа монтажной документации и представление распознанной информации в виде, соответствующем структуре таблицы в целом
Выводы.
Глава V. Основные результаты исследования.
Модели и алгоритмы распознавания железнодорожной технической документации (реферат, курсовая, диплом, контрольная)
Развитие железнодорожного транспорта обусловлено разработкой и внедрением в производственный процесс наукоёмких технологий с целью его полной или частичной автоматизации. Необходимым условием применения современных производственных технологий является требование ведения документации на электронном носителе. Таким образом, важным составным элементом производственного процесса является комплекс технических средств поддержки работы с документами.
Вся техническая информация должна быть представлена на электронном носителе в структурированном виде, соответствующем её смысловому содержанию, то есть необходимо разработать многофункциональную программу создания, модификации и использования электронной базы данных железнодорожной документации.
Исходная техническая информация для электронной базы данных в значительном числе случаев представлена в виде рукописных чертежей или копий с них на бумажном носителе, поэтому необходим пакет программ для предварительной обработки изображения и его последующего распознавания с целью представления железнодорожной документации в сжатой и удобной для использования форме.
Известные программы машинного распознавания предназначены главным образом для чтения печатных текстов (FineReader). Разработки пакетов прикладных программ широкого профиля для расшифровки технической рукописной информации далеки от своего завершения. В данном случае также следует учесть, что при распознавании узкоспециализированной инженерной документации необходимо использовать дополнительные данные о возможном смысловом содержании текстографической информации с целью более эффективного распознавания.
Учитывая вышесказанное, необходимо отметить, что для автоматизации процесса создания электронной базы данных железнодорожной документации требуется узкоспециализированный пакет программ чтения и декодирования инженерной транспортной информации или программные средства широкого профиля с возможностью их адаптации к задачам обработки изображения технической документации и адекватного её отражения в электронной базе данных рассматриваемой отрасли.
В данной работе рассматривается подход, связанный с созданием узкоспециализированного комплекса программ обработки железнодорожной документации, в частности расшифровке схем комплектации приборов железнодорожных станций и монтажных карточек данных приборов, так как в настоящее время значительная часть документов отрасли относится к вышеуказанному типу.
Разработка эффективного комплекса программ распознавания изображения технической документации возможна при соблюдении следующих условий.
• Применение новых математических методов при построении алгоритмов предварительной обработки непосредственного распознавания.
• Использование обобщённого метода, включающего различные методы расшифровки технической документации;
• Адаптация методов к распознаванию железнодорожной документации с целью использования возможного смыслового содержания декодируемой информации.
Таким образом, целью настоящей работы является эффективная модификация современных методов обработки и распознавания изображения с целью применения их для построения электронной базы данных железнодорожной документации и создание прототипа комплекса программ для апробации вышеуказанных модификаций. Данная научная задача является актуальной, так как построение электронной базы данных вручную является трудоёмким процессом, при этом эффективные пакеты программ для выполнения этой работы отсутствуют.
Для достижения поставленной цели и решения научной задачи в работе осуществляется решение подзадач исследования:
1. Разработка методов предварительной обработки изображения листа монтажной документации с целью устранения посторонних неинформативных элементов, шумов и помех. Проверка эффективности предлагаемых методов.
2. Разработка алгоритма сегментации изображения листа монтажной документации и определения главной таблицы на изображении.
3. Разработка методов автоматического распознавания специальных знаков и структуры таблиц.
4. Разработка модели процесса автоматического распознавания чертёжных рукописных символов, представленных в таблицах монтажной документации систем железнодорожной автоматики.
В ходе решения данной задачи были получены следующие положения:
1. Методы и алгоритмы предварительной обработки изображений специализированной технической документации для систем железнодорожной автоматики.
2. Алгоритм распознавания структуры монтажных карточек и схем комплектации.
3. Модель процесса автоматического распознавания символов технической документации.
4. Модель распознавания МКСЖА и СКСЖА как целостных структур. Научная новизна работы состоит в том, что разработан метод и инструмент эффективного удаления шумов из изображения листа ТЖД, вызванных многократным копированием, сконструированный с учётом особенности данной документациипредложен комплекс методов распознавания таблицы для специализированной технической документации, отличающийся от применявшихся ранее малой трудоёмкостью и возможностью построения таблицы по её фрагментам.
Разработанная модель процесса автоматического распознавания символа ТЖД отличается новым алгоритмом выбора параметров построения скелетов для символов специализированной технической документации, основанным на концепциях предварительного определения характеристик границ символа и распространения волновых фронтов от границ области. Предложенный алгоритм распознавания изображения МКСЖА или СКСЖА отличается от применяемых ранее подходом, при котором ЛМД рассматривается как целостная структура.
4.10. Выводы.
Модель процесса автоматического распознавания символов специализированной технической документации имеет следующие особенности.
• Распознавание символов, расположенных в ячейках таблицы, осуществляется после распознавания общей структуры таблицы, так как после данного этапа примерные размеры символов, их средняя толщина и множества предполагаемого расположения становятся известными.
• Алгоритм построения скелета символа основывается на моделировании распространения волновых фронтов, начинающихся от границ связного множества и сопоставлении определённого цвета каждой точке его границы и установлении точек скелета символа по скачкообразному изменению цвета (величина скачка сравнивается с пороговым значением, являющимся параметром алгоритма).
• Инструмент создания и пополнения базы данных скелетных графов эталонных символов позволяет учитывать особенности шрифта и подчерка. «.
• Сравнение скелетных графов распознаваемых и эталонных символов производится с учётом топологических характеристик графов после установления гомеоморфизма последних. При сопоставлении соответствующих ветвей гомеоморфных графов осуществляется подразбиение ребер, выполняемое в целях уравнивания количества вершин на сопоставляемых ветвях.
• Модель распознавания монтажной карточки или схемы комплектации как целостной структуры, включает в себя структуризацию текста ячейки, объединение разрозненных символов в слова и строки и алгоритм распознавания ячейки таблицы монтажной карточки или схемы комплектации.
• Модель распознавания монтажной карточки или схемы комплектации включает в себя установление внутренних и внешних связей между ячейками таблицы и другими таблицами.
Глава У. Основные результаты исследования.
В ходе исследования были получены следующие основные результаты.
1. Разработаны специализированные модели и алгоритмы предварительной обработки изображений листов монтажной документации для систем железнодорожной автоматики. Создан прототип программы, осуществляющий данные методы.
2. Обоснованы и сконструированы специализированные способы сегментации изображения в целях отделения его структурных элементов: таблиц, символов и специальных знаков применительно к монтажным карточкам и схемам комплектации систем железнодорожной автоматики.
3. Предложена модель, алгоритм и программа процесса автоматического распознавания символов специализированной технической документации для систем железнодорожной автоматики. Разработан новый алгоритм построения скелета символа, основанный на распространении волн, начинающихся в точках границы символа. Создан прототип программы, осуществляющий построение скелета, с помощью рассматриваемого алгоритма.
4. Разработаны методы распознавания монтажных карточек и схем комплектации как целостных структур, что позволило добиться повышения эффективности обработки изображения специализированной технической документации.
5. Предложены способы представления распознанной информации. Создан прототип соответствующей программы.
Полученные результаты имеют практическую ценность.
1. Предложенная модель процесса автоматического распознавания символов применима при распознавании произвольных текстов.
2. Предлагаемые алгоритмы и способы позволят увеличить эффективность внедрения электронной базы данных систем железнодорожной автоматики.
3. Разработанный метод автоматического распознавания технологической карты систем железнодорожной автоматики позволяет существенно автоматизировать работу оператора по созданию электронной базы технологических карт систем железнодорожной автоматики.
Список литературы
- Ту Дж., Гонсалес Р. Принципы распознавания образов / под р. Журавлева Ю. И. М.: Мир, 1978. — 401 с.
- Банков А. М., Кузин Е. С., Шамис A. Л! Пакет программ для распознавания рукописной символьной и графической информации // Искусственный интеллект. Кн. 1, — М.: Радио и связь, 1990, 179 с.
- Хармут X. Теория секвентного анализа. — М.: Мир 1980. 152 с.
- Престон П. Пространственно-частотная фильтрация объектов. — М.: Мир 1980.-172 с.
- Фурман Я. А., Кревецкий А. В., Передреев А. К., Роженцов А. А., Хафизов Р. Г., Егшина И. JL, Леухин А. Н. Введение в контурный анализ и его приложения к обработке изображений и сигналов. — М.: ФИЗМАТЛИТ, 2002. 588 с.
- Фурман Я. А., Кревецкий А. В. Комлекснозначные и кватернионные сигналы и подходы к их обработке // Изв. вузов. Приборостроение, 4, 2006.-102 с.
- Котович А. А., Славин В. Н. Распознавание скелетных образов // Методы и средства работы с документами. Сборник трудов Института системного анализа РАН 2000. М.: УРСС, 2000. — 347 с.
- Canny J. A. Computational approach to edge detection: IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986. Vol. 8, N 6, pp 679−698.
- Lam L. Suen C. An Evaluation of Parallel Thinning Algorithms for Character Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, № 9, 1995. p. 914−919.
- Местецкий JI. А., Рейер И. А. Непрерывное скелетное представление изображения с контролируемой точностью // Международная конференция «Графикон-2004». М.: МГУ. 2004.-269 с.
- Местецкий Л. А., Семёнов А. Б. Преобразование цветных изображений на основе жирных Б-сплайновых кривых // Труды международной конференции «Графикон-2003» 2003. — 252 с.
- Шикин Е. В., Боресков А. В., Шикина Г. Е. Компьютерная графика М.: Финансы и статистика, 1996. — 173 с.
- Математическая энциклопедия — М.: Советская энциклопедия, 1982. — 5 т. 658 с.
- Логно Д. В., Соболев А. С. Модифицированные алгоритмы Форчуна и Ли скелетизации многоугольной фигуры // Труды международной конференции «Графикон-2001», 2001. 121 с.
- Рейер И. А. Сегментация штрихов и их соединений при распознавании рукописного текста // Труды международной конференции «Графикон-1999″, 1999.-151 с.
- Препарата Ф., Шеймос М. Вычислительная геометрия. Введение М.: Мир, 1989−149 с.
- Lee D. T. Medial axes transform of planar shape // IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-4 (1982), 363−369p.
- Гэри M. P., Джонсон Д. С. Вычислительные машины и труднорешаемые задачи М.: Мир, 1982 — 411 с.
- Кнут М. Искусство программирования для ЭВМ М.: Мир, 1978 — 3 т. 272 с.
- Zhang T. Y., Suen С. Y. A fast parallel algorithm for thinning digital patterns. // IEEE, Communications of the ACM. Vol. 27. — № 3 — 1984. — 236 p.
- Гнеденко Б. В. Курс теории вероятностей — М.: Наука, 1988 — 406 с.
- Боровков А. А. Математическая статистика —М.: Наука, 1984 469 с.
- Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа-М.: ФИЗМАТЛИТ, 2006 570 с.
- Добеши И. Десять лекций по вейвлетам — Ижевск: 2004.
- Чуй К. Введение в вейвлеты М.: Мир, 2001 — 412с.
- Старовойтов В. В. Локальные геометрические методы цифровой обработки и анализа изображений Минск, 1997.
- Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Исследование зависимостей: Справ, изд. Айвазяна С. А. / Под ред. М.: Финансы и статистика, 1985. — 487 с.
- Архангельский А. Я. Программирование в С++ Builder 6 M.: Бином, 2005.-1162 с.
- Бабенко К. И. Основы численного анализа — Ижевск: РХД, 2002. — 848 с.
- Баскакова Л. В., Журавлев Ю. И. Модель распознающих алгоритмов с представительными наборами и системами опорных множеств // Журнал вычислительной математики и математической физики. Т. 21, № 5. М.: УРСС, 1981.-1264 с.
- Бауэр Ф. Л., Гооз Г. Информатика М.: Мир, 1990. — 742 с.
- Беннет Д. Visual С++ 5 M.: Диалектика, 1998. — 767 с.
- Биллингсли П. Сходимость вероятностных мер — М.: Наука, 1981. 431 с.
- Большев Л. Н., Смирнов Н. В. Таблицы математической статистики М.: Наука, 1983−415 с.
- Братчиков И. Л., Ань Хан Тхе Новые методы предварительной обработки для систем распознавания рукописного текста // Вестник СПбГУ. Сер. 10, 2008, вып. 1,-16 с.
- Вайнцвайг M. Н., Полякова М. П. О моделировании мышления // От моделей поведения к искусственному интеллекту М.: УРСС, 2006. — 286 с.
- Ван дер Варден Б. Л. Алгебра М.: Наука, 1976. — 648 с.
- Вапник В. Н., Червоненкис А. Я. Теория распознавания образов — М.: Наука, 1974.-415 с.
- Василенко М. Н., Соколов М. Б. Применение метода процессного моделирования для анализа тональных рельсовых цепей // Вестник Ростовского государственного университета путей сообщения, 4 — 2007. -31 с.
- Власов А. В., Шамис А. Л. Экспериментальные системы зрительного восприятия для роботов // Интегральные роботы, — М.: Мир, 1975, — 28 с.
- Вороной Г. Ф. Собрание сочинений. Т. 1 Т. 2 — К.: 1952. — 368 с.
- Гонсалес Р. С., Вудс Р. Е., Эддинс С. Л. Цифровая обработка изображений в среде МАТЛАБ М.: Техносфера, 2006. — 203 с.
- Горбачёв А. М. Автоматизация синтеза кабельных сетей железнодорожной автоматики и телемеханики // Известия Петербургского Университета Путей Сообщения. СПб.: Петербургский государственный университет путей сообщения, 2009. -№ 1. С. 52−61.
- Горелик А. Л., Скрикин В. А. Методы распознавания М.: Высшая школа, 1989.
- Грегори К. Использование Visual С++ 6 М.: Вильяме, 2000. — 849 с.
- Грис Д. Наука программирования М.: Мир, 1984. — 416 с.
- Дейтел X. М., Дейтел П. Дж. Как программировать на С++ — М.: Бином, 1998.-1021 с.
- Дуда Р., Харт П. Распознавание образов и анализ сцен М.: Мир, 1976., — 511 с.
- Дюк В. А. Компьютерная психодиагностика СПб.: Братство, 1994. — 363 с.
- Журавлев Ю. И. Избранные научные труды М.: Магистр, 1998. — 420 с.
- Журавлев Ю. И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики М.: Наука, 1978. Вып. 33.-5 с.
- Журавлев Ю. И., Рязанов В. В., Сенько О. В. Распознавание. Математические методы. Программная система. Практические применения —М.: Фазис, 2005. — 159 с.
- Загоруйко Н. Г. Методы распознавания и их применение М.: Сов. радио, 1972.-206 с.
- Загоруйко Н. Г. Прикладные методы анализа данных и знаний — Новосибирск: Изд-во Института математики, 1999. — 211 с.
- Зуев Ю. А. Метод повышения надежности классификации при наличии .нескольких классификаторов, основанный на принципе монотонности // ЖВМиМФ. М.: УРСС, Т. 21. № 1, 1981. 157 с.
- Ильин В. А., Ким Г. Д. Линейная алгебра и аналитическая геометрия — М.: Издательство Московского Университета, 2007. — 392 с.
- Калверт Ч., Рейсдорф К. Borland С++ Builder 5 Киев: Диасофт, 2001. -937 с.
- Капустий Б. Е., Русын Б. П., Таянов В. А. Новый подход к определению вероятности правильного распознавания объектов множеств // УСиМ, 2, 2005. 8 с.
- Келли Дж. JI. Общая топология М.: Наука, 1981.-431 с.
- Кокс Д., Хинкли Д. Теоретическая статистика М.: Мир, 1978. — 558 с.
- Колмогоров А. Н. Теория информации и теория алгоритмов М.: Наука, 1987. 163 с.
- Кормен Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ М.: МЦНМО, 2004. — 955 с.
- Кочетков Д. В. Распознающие алгоритмы, инвариантные относительно преобразований пространства признаков // Распознавание, классификация, прогноз: Мат. методы и их применение Вып. И — М.: Наука, 1989.-178 с.
- Крамер Г. Математические методы статистики — М.: Мир, 1976 —302 с.
- Кудрявцев В. Б., Андреев А. Е., Гасанов Э. Э. Теория тестового распознавания -М.: ФИЗМАТЛИТ, 2007. 355 с.
- Лбов Г. С. Методы обработки разнотипных экспериментальных данных — Новосибирск: Наука, 1981. 212с.
- Лбов Г. С., Старцева Н. Г. Логические решающие функции и вопросы статистической устойчивости решений — Новосибирск: Изд-в. Ин-та математики СО РАН, 1999. 150 с.
- Лепский А. Е., Броневич А. Г. Математические методы распознавания образов Таганрог: ТТИЮФУ, 2009.- 156 с.. .
- Лутманов С. В. Курс лекций по методам оптимизации Ижевск: РХД, 2001.-368 с.
- Мирошниченко С. Ю., Мишустин В. Н., Дегтярёв С. В. Распознающий аппаратно-программный диагностирующий комплекс // Изв. вузов. Приборостроение, 2, 2005. 112 с.
- Новиков Ф. А. Дискретная математика для программистов СПб.: Питер, 2004.-301 с.
- Овсиенко В. Ю., Табачников С. Л. Проективная дифференциальная геометрия М.: МЦНМО, 2008. — 237 с.
- Ope О. Теория графов М.: Наука, 1980. — 336 с.
- Пытьев Ю. П. Морфологический анализ изображений // Докл. АН СССР. Т. 269, № 5. М.: УРСС, 1983. 1061 с.
- Рашевский П. К. Курс дифференциальной геометрии М.: УРСС, 2003. -428 с.
- Стокман Джордж, Шапиро Линда Компьютерное зрение М.: Бином. Лаборатория знаний, 2006. — 752 с.
- Федорчук В. В., Филиппов В. В. Общая топология. Основные конструкции М.: Издательство Московского Университета, 1988. — 251 с.
- Форсайт Дэвид А., Понс Джин Компьютерное зрение. Современный подход М.: Вильяме, 2004. — 928 с.
- Чен Ш. К. Принципы проектирования систем визуальной информации — М.: Мир, 1994.
- Ширяев А. Н. Вероятность М.: Наука, 1989 — 638 с.
- Blum Н. A transformation for extracting new descriptors of shape // Models for the Perception of Speech and Visual Form, MIT Press, 1967.8 7 6 5 4 3 2 1
- Аи/е- /ч/ю* нми/г-чоЯ» ими г- чооо^ лниме-зю* нмшг-воо"-/7/?/ г гс//г и. НО /ГСМР! Нхг>пе-*> НОРУ Р 4 <
- У н/чп/ег-ЯСОх /440* дуи-дал^л-, «, ео Ими//. /440'* рмш/- гччо* нмш/ -/чча~ ШЧ' .иу ¦ .вг УАК-вБ^ «¦/А/7ЛРР ч<�ипР<*, кме/г- 4гхо //мл/г-гвос пчо НМШЗ-':<№)* кБл^а/-^1. К/ «•И/ иг
- ЧА&Ь'Г^ УД, Г?/7 С 9А' ЧАРУР<*~ О НССРць,6 елш> н/ги/мг-зго н /»?улгг-зго нлпгу^г-эге. «/"ШЬ-ШОО мг-?о/М1 -//го НМШ1- /440 иу и? •X/