Диплом, курсовая, контрольная работа
Помощь в написании студенческих работ

Модели и алгоритмы распознавания железнодорожной технической документации

ДиссертацияПомощь в написанииУзнать стоимостьмоей работы

Разработанная модель процесса автоматического распознавания символа ТЖД отличается новым алгоритмом выбора параметров построения скелетов для символов специализированной технической документации, основанным на концепциях предварительного определения характеристик границ символа и распространения волновых фронтов от границ области. Предложенный алгоритм распознавания изображения МКСЖА или СКСЖА… Читать ещё >

Содержание

  • СПИСОК УСЛОВНЫХ СОКРАЩЕНИЙ И ОСНОВНЫЕ ОБОЗНАЧЕНИЯ

Глава I. Структура изображения листа монтажной железнодорожной документации. Анализ технических средств распознавания документов и теоретических основ алгоритмов обработки изображения чертежей и текстовой информации

1.1 Структура и особенности изображения листа монтажной документации для систем железнодорожной автоматики.

1.2 Пакеты программ технического чтения.

1.3 Алгоритмы предварительной обработки изображения.

1.4 Теоретические основы алгоритмов распознавания.

1.5 Выводы и постановка задачи исследования.

Глава II. Предварительная обработка изображения листа монтажной документации с целью удаления шумов и искажений

2.1 Перевод изображений технических железнодорожных документов в чёрно-белую палитру без применения алгоритмов фильтрации.

2.2 Устранение шумов перед переводом изображения в черно-белый вид.

2.3 Применение преобразования Уолша

2.4 Устранение шумов с помощью вещественного косинус-преобразования и комплексного дискретного преобразования Фурье.

2.5 Удаление помех перед разграничением объекта и фона.

2.6 Влияние качества фильтрации на последующую обработку изображения.

2.7 Выводы.

Глава III. Распознавание таблиц железнодорожной документации.

3.1 Распознавание таблиц при высоком качестве изображения.

3.2 Поиск горизонтальных и вертикальных линий для таблиц, построенных вручную.

3.3 Алгоритм поиска разрывов без наложения для горизонтальных линий.

3.4 Алгоритм поиска разрывов с наложением.

3.5 Распознавание структуры таблицы монтажной документации для систем железнодорожной автоматики.

3.6 Выводы.

Глава IV. Модели процессов распознавания символов и распознавания таблицы монтажной документации для систем железнодорожной автоматики как целостной структуры.

4.1 Особенности задачи распознавания символьной информации, представленной в таблицах ТЖД

4.2 Выделение связных множеств и выдвижение гипотез о принадлежности рассматриваемых множеств к семейству изображений символов как модель процесса автоматической сегментации символов внутри ячеек

4.3 Скелетизация множества

4.4 Граница множества и алгоритм обхода границы.

4.5 Алгоритмы построения скелетного графа символа для изображения высокого качества

4.6 Алгоритм построения скелетного графа символа для изображения невысокого качества

4.7 Построение базы данных скелетных графов эталонных символов для монтажной документации систем железнодорожной автоматики.

4.8 Проверка гипотезы о принадлежности распознаваемой области множеству символом и выбор символа с помощью базы данных скелетных графов эталонных символов.

4.9 Объединение символов, расположенных в ячейках таблицы, в слова и строки. Модель распознавания листа монтажной документации и представление распознанной информации в виде, соответствующем структуре таблицы в целом

Выводы.

Глава V. Основные результаты исследования.

Модели и алгоритмы распознавания железнодорожной технической документации (реферат, курсовая, диплом, контрольная)

Развитие железнодорожного транспорта обусловлено разработкой и внедрением в производственный процесс наукоёмких технологий с целью его полной или частичной автоматизации. Необходимым условием применения современных производственных технологий является требование ведения документации на электронном носителе. Таким образом, важным составным элементом производственного процесса является комплекс технических средств поддержки работы с документами.

Вся техническая информация должна быть представлена на электронном носителе в структурированном виде, соответствующем её смысловому содержанию, то есть необходимо разработать многофункциональную программу создания, модификации и использования электронной базы данных железнодорожной документации.

Исходная техническая информация для электронной базы данных в значительном числе случаев представлена в виде рукописных чертежей или копий с них на бумажном носителе, поэтому необходим пакет программ для предварительной обработки изображения и его последующего распознавания с целью представления железнодорожной документации в сжатой и удобной для использования форме.

Известные программы машинного распознавания предназначены главным образом для чтения печатных текстов (FineReader). Разработки пакетов прикладных программ широкого профиля для расшифровки технической рукописной информации далеки от своего завершения. В данном случае также следует учесть, что при распознавании узкоспециализированной инженерной документации необходимо использовать дополнительные данные о возможном смысловом содержании текстографической информации с целью более эффективного распознавания.

Учитывая вышесказанное, необходимо отметить, что для автоматизации процесса создания электронной базы данных железнодорожной документации требуется узкоспециализированный пакет программ чтения и декодирования инженерной транспортной информации или программные средства широкого профиля с возможностью их адаптации к задачам обработки изображения технической документации и адекватного её отражения в электронной базе данных рассматриваемой отрасли.

В данной работе рассматривается подход, связанный с созданием узкоспециализированного комплекса программ обработки железнодорожной документации, в частности расшифровке схем комплектации приборов железнодорожных станций и монтажных карточек данных приборов, так как в настоящее время значительная часть документов отрасли относится к вышеуказанному типу.

Разработка эффективного комплекса программ распознавания изображения технической документации возможна при соблюдении следующих условий.

• Применение новых математических методов при построении алгоритмов предварительной обработки непосредственного распознавания.

• Использование обобщённого метода, включающего различные методы расшифровки технической документации;

• Адаптация методов к распознаванию железнодорожной документации с целью использования возможного смыслового содержания декодируемой информации.

Таким образом, целью настоящей работы является эффективная модификация современных методов обработки и распознавания изображения с целью применения их для построения электронной базы данных железнодорожной документации и создание прототипа комплекса программ для апробации вышеуказанных модификаций. Данная научная задача является актуальной, так как построение электронной базы данных вручную является трудоёмким процессом, при этом эффективные пакеты программ для выполнения этой работы отсутствуют.

Для достижения поставленной цели и решения научной задачи в работе осуществляется решение подзадач исследования:

1. Разработка методов предварительной обработки изображения листа монтажной документации с целью устранения посторонних неинформативных элементов, шумов и помех. Проверка эффективности предлагаемых методов.

2. Разработка алгоритма сегментации изображения листа монтажной документации и определения главной таблицы на изображении.

3. Разработка методов автоматического распознавания специальных знаков и структуры таблиц.

4. Разработка модели процесса автоматического распознавания чертёжных рукописных символов, представленных в таблицах монтажной документации систем железнодорожной автоматики.

В ходе решения данной задачи были получены следующие положения:

1. Методы и алгоритмы предварительной обработки изображений специализированной технической документации для систем железнодорожной автоматики.

2. Алгоритм распознавания структуры монтажных карточек и схем комплектации.

3. Модель процесса автоматического распознавания символов технической документации.

4. Модель распознавания МКСЖА и СКСЖА как целостных структур. Научная новизна работы состоит в том, что разработан метод и инструмент эффективного удаления шумов из изображения листа ТЖД, вызванных многократным копированием, сконструированный с учётом особенности данной документациипредложен комплекс методов распознавания таблицы для специализированной технической документации, отличающийся от применявшихся ранее малой трудоёмкостью и возможностью построения таблицы по её фрагментам.

Разработанная модель процесса автоматического распознавания символа ТЖД отличается новым алгоритмом выбора параметров построения скелетов для символов специализированной технической документации, основанным на концепциях предварительного определения характеристик границ символа и распространения волновых фронтов от границ области. Предложенный алгоритм распознавания изображения МКСЖА или СКСЖА отличается от применяемых ранее подходом, при котором ЛМД рассматривается как целостная структура.

4.10. Выводы.

Модель процесса автоматического распознавания символов специализированной технической документации имеет следующие особенности.

• Распознавание символов, расположенных в ячейках таблицы, осуществляется после распознавания общей структуры таблицы, так как после данного этапа примерные размеры символов, их средняя толщина и множества предполагаемого расположения становятся известными.

• Алгоритм построения скелета символа основывается на моделировании распространения волновых фронтов, начинающихся от границ связного множества и сопоставлении определённого цвета каждой точке его границы и установлении точек скелета символа по скачкообразному изменению цвета (величина скачка сравнивается с пороговым значением, являющимся параметром алгоритма).

• Инструмент создания и пополнения базы данных скелетных графов эталонных символов позволяет учитывать особенности шрифта и подчерка. «.

• Сравнение скелетных графов распознаваемых и эталонных символов производится с учётом топологических характеристик графов после установления гомеоморфизма последних. При сопоставлении соответствующих ветвей гомеоморфных графов осуществляется подразбиение ребер, выполняемое в целях уравнивания количества вершин на сопоставляемых ветвях.

• Модель распознавания монтажной карточки или схемы комплектации как целостной структуры, включает в себя структуризацию текста ячейки, объединение разрозненных символов в слова и строки и алгоритм распознавания ячейки таблицы монтажной карточки или схемы комплектации.

• Модель распознавания монтажной карточки или схемы комплектации включает в себя установление внутренних и внешних связей между ячейками таблицы и другими таблицами.

Глава У. Основные результаты исследования.

В ходе исследования были получены следующие основные результаты.

1. Разработаны специализированные модели и алгоритмы предварительной обработки изображений листов монтажной документации для систем железнодорожной автоматики. Создан прототип программы, осуществляющий данные методы.

2. Обоснованы и сконструированы специализированные способы сегментации изображения в целях отделения его структурных элементов: таблиц, символов и специальных знаков применительно к монтажным карточкам и схемам комплектации систем железнодорожной автоматики.

3. Предложена модель, алгоритм и программа процесса автоматического распознавания символов специализированной технической документации для систем железнодорожной автоматики. Разработан новый алгоритм построения скелета символа, основанный на распространении волн, начинающихся в точках границы символа. Создан прототип программы, осуществляющий построение скелета, с помощью рассматриваемого алгоритма.

4. Разработаны методы распознавания монтажных карточек и схем комплектации как целостных структур, что позволило добиться повышения эффективности обработки изображения специализированной технической документации.

5. Предложены способы представления распознанной информации. Создан прототип соответствующей программы.

Полученные результаты имеют практическую ценность.

1. Предложенная модель процесса автоматического распознавания символов применима при распознавании произвольных текстов.

2. Предлагаемые алгоритмы и способы позволят увеличить эффективность внедрения электронной базы данных систем железнодорожной автоматики.

3. Разработанный метод автоматического распознавания технологической карты систем железнодорожной автоматики позволяет существенно автоматизировать работу оператора по созданию электронной базы технологических карт систем железнодорожной автоматики.

Показать весь текст

Список литературы

  1. Ту Дж., Гонсалес Р. Принципы распознавания образов / под р. Журавлева Ю. И. М.: Мир, 1978. — 401 с.
  2. А. М., Кузин Е. С., Шамис A. Л! Пакет программ для распознавания рукописной символьной и графической информации // Искусственный интеллект. Кн. 1, — М.: Радио и связь, 1990, 179 с.
  3. X. Теория секвентного анализа. — М.: Мир 1980. 152 с.
  4. П. Пространственно-частотная фильтрация объектов. — М.: Мир 1980.-172 с.
  5. Я. А., Кревецкий А. В., Передреев А. К., Роженцов А. А., Хафизов Р. Г., Егшина И. JL, Леухин А. Н. Введение в контурный анализ и его приложения к обработке изображений и сигналов. — М.: ФИЗМАТЛИТ, 2002. 588 с.
  6. Я. А., Кревецкий А. В. Комлекснозначные и кватернионные сигналы и подходы к их обработке // Изв. вузов. Приборостроение, 4, 2006.-102 с.
  7. А. А., Славин В. Н. Распознавание скелетных образов // Методы и средства работы с документами. Сборник трудов Института системного анализа РАН 2000. М.: УРСС, 2000. — 347 с.
  8. Canny J. A. Computational approach to edge detection: IEEE Transactions on Pattern Analysis and Machine Intelligence, 1986. Vol. 8, N 6, pp 679−698.
  9. Lam L. Suen C. An Evaluation of Parallel Thinning Algorithms for Character Recognition // IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 17, № 9, 1995. p. 914−919.
  10. JI. А., Рейер И. А. Непрерывное скелетное представление изображения с контролируемой точностью // Международная конференция «Графикон-2004». М.: МГУ. 2004.-269 с.
  11. Л. А., Семёнов А. Б. Преобразование цветных изображений на основе жирных Б-сплайновых кривых // Труды международной конференции «Графикон-2003» 2003. — 252 с.
  12. Е. В., Боресков А. В., Шикина Г. Е. Компьютерная графика М.: Финансы и статистика, 1996. — 173 с.
  13. Математическая энциклопедия — М.: Советская энциклопедия, 1982. — 5 т. 658 с.
  14. Д. В., Соболев А. С. Модифицированные алгоритмы Форчуна и Ли скелетизации многоугольной фигуры // Труды международной конференции «Графикон-2001», 2001. 121 с.
  15. И. А. Сегментация штрихов и их соединений при распознавании рукописного текста // Труды международной конференции «Графикон-1999″, 1999.-151 с.
  16. Ф., Шеймос М. Вычислительная геометрия. Введение М.: Мир, 1989−149 с.
  17. Lee D. T. Medial axes transform of planar shape // IEEE Transactions on Pattern Analysis and Machine Intelligence. PAMI-4 (1982), 363−369p.
  18. M. P., Джонсон Д. С. Вычислительные машины и труднорешаемые задачи М.: Мир, 1982 — 411 с.
  19. М. Искусство программирования для ЭВМ М.: Мир, 1978 — 3 т. 272 с.
  20. Zhang T. Y., Suen С. Y. A fast parallel algorithm for thinning digital patterns. // IEEE, Communications of the ACM. Vol. 27. — № 3 — 1984. — 236 p.
  21. . В. Курс теории вероятностей — М.: Наука, 1988 — 406 с.
  22. А. А. Математическая статистика —М.: Наука, 1984 469 с.
  23. А. Н., Фомин С. В. Элементы теории функций и функционального анализа-М.: ФИЗМАТЛИТ, 2006 570 с.
  24. И. Десять лекций по вейвлетам — Ижевск: 2004.
  25. Чуй К. Введение в вейвлеты М.: Мир, 2001 — 412с.
  26. В. В. Локальные геометрические методы цифровой обработки и анализа изображений Минск, 1997.
  27. С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: Исследование зависимостей: Справ, изд. Айвазяна С. А. / Под ред. М.: Финансы и статистика, 1985. — 487 с.
  28. А. Я. Программирование в С++ Builder 6 M.: Бином, 2005.-1162 с.
  29. К. И. Основы численного анализа — Ижевск: РХД, 2002. — 848 с.
  30. Л. В., Журавлев Ю. И. Модель распознающих алгоритмов с представительными наборами и системами опорных множеств // Журнал вычислительной математики и математической физики. Т. 21, № 5. М.: УРСС, 1981.-1264 с.
  31. Ф. Л., Гооз Г. Информатика М.: Мир, 1990. — 742 с.
  32. Беннет Д. Visual С++ 5 M.: Диалектика, 1998. — 767 с.
  33. П. Сходимость вероятностных мер — М.: Наука, 1981. 431 с.
  34. Л. Н., Смирнов Н. В. Таблицы математической статистики М.: Наука, 1983−415 с.
  35. И. Л., Ань Хан Тхе Новые методы предварительной обработки для систем распознавания рукописного текста // Вестник СПбГУ. Сер. 10, 2008, вып. 1,-16 с.
  36. M. Н., Полякова М. П. О моделировании мышления // От моделей поведения к искусственному интеллекту М.: УРСС, 2006. — 286 с.
  37. Ван дер Варден Б. Л. Алгебра М.: Наука, 1976. — 648 с.
  38. В. Н., Червоненкис А. Я. Теория распознавания образов — М.: Наука, 1974.-415 с.
  39. М. Н., Соколов М. Б. Применение метода процессного моделирования для анализа тональных рельсовых цепей // Вестник Ростовского государственного университета путей сообщения, 4 — 2007. -31 с.
  40. А. В., Шамис А. Л. Экспериментальные системы зрительного восприятия для роботов // Интегральные роботы, — М.: Мир, 1975, — 28 с.
  41. Г. Ф. Собрание сочинений. Т. 1 Т. 2 — К.: 1952. — 368 с.
  42. Р. С., Вудс Р. Е., Эддинс С. Л. Цифровая обработка изображений в среде МАТЛАБ М.: Техносфера, 2006. — 203 с.
  43. А. М. Автоматизация синтеза кабельных сетей железнодорожной автоматики и телемеханики // Известия Петербургского Университета Путей Сообщения. СПб.: Петербургский государственный университет путей сообщения, 2009. -№ 1. С. 52−61.
  44. А. Л., Скрикин В. А. Методы распознавания М.: Высшая школа, 1989.
  45. К. Использование Visual С++ 6 М.: Вильяме, 2000. — 849 с.
  46. Д. Наука программирования М.: Мир, 1984. — 416 с.
  47. X. М., Дейтел П. Дж. Как программировать на С++ — М.: Бином, 1998.-1021 с.
  48. Р., Харт П. Распознавание образов и анализ сцен М.: Мир, 1976., — 511 с.
  49. Дюк В. А. Компьютерная психодиагностика СПб.: Братство, 1994. — 363 с.
  50. Ю. И. Избранные научные труды М.: Магистр, 1998. — 420 с.
  51. Ю. И. Об алгебраическом подходе к решению задач распознавания или классификации // Проблемы кибернетики М.: Наука, 1978. Вып. 33.-5 с.
  52. Ю. И., Рязанов В. В., Сенько О. В. Распознавание. Математические методы. Программная система. Практические применения —М.: Фазис, 2005. — 159 с.
  53. Н. Г. Методы распознавания и их применение М.: Сов. радио, 1972.-206 с.
  54. Н. Г. Прикладные методы анализа данных и знаний — Новосибирск: Изд-во Института математики, 1999. — 211 с.
  55. Ю. А. Метод повышения надежности классификации при наличии .нескольких классификаторов, основанный на принципе монотонности // ЖВМиМФ. М.: УРСС, Т. 21. № 1, 1981. 157 с.
  56. В. А., Ким Г. Д. Линейная алгебра и аналитическая геометрия — М.: Издательство Московского Университета, 2007. — 392 с.
  57. Ч., Рейсдорф К. Borland С++ Builder 5 Киев: Диасофт, 2001. -937 с.
  58. . Е., Русын Б. П., Таянов В. А. Новый подход к определению вероятности правильного распознавания объектов множеств // УСиМ, 2, 2005. 8 с.
  59. Дж. JI. Общая топология М.: Наука, 1981.-431 с.
  60. Д., Хинкли Д. Теоретическая статистика М.: Мир, 1978. — 558 с.
  61. А. Н. Теория информации и теория алгоритмов М.: Наука, 1987. 163 с.
  62. Т., Лейзерсон Ч., Ривест Р. Алгоритмы: построение и анализ М.: МЦНМО, 2004. — 955 с.
  63. Д. В. Распознающие алгоритмы, инвариантные относительно преобразований пространства признаков // Распознавание, классификация, прогноз: Мат. методы и их применение Вып. И — М.: Наука, 1989.-178 с.
  64. Г. Математические методы статистики — М.: Мир, 1976 —302 с.
  65. В. Б., Андреев А. Е., Гасанов Э. Э. Теория тестового распознавания -М.: ФИЗМАТЛИТ, 2007. 355 с.
  66. Г. С. Методы обработки разнотипных экспериментальных данных — Новосибирск: Наука, 1981. 212с.
  67. Г. С., Старцева Н. Г. Логические решающие функции и вопросы статистической устойчивости решений — Новосибирск: Изд-в. Ин-та математики СО РАН, 1999. 150 с.
  68. А. Е., Броневич А. Г. Математические методы распознавания образов Таганрог: ТТИЮФУ, 2009.- 156 с.. .
  69. С. В. Курс лекций по методам оптимизации Ижевск: РХД, 2001.-368 с.
  70. С. Ю., Мишустин В. Н., Дегтярёв С. В. Распознающий аппаратно-программный диагностирующий комплекс // Изв. вузов. Приборостроение, 2, 2005. 112 с.
  71. Ф. А. Дискретная математика для программистов СПб.: Питер, 2004.-301 с.
  72. В. Ю., Табачников С. Л. Проективная дифференциальная геометрия М.: МЦНМО, 2008. — 237 с.
  73. Ope О. Теория графов М.: Наука, 1980. — 336 с.
  74. Ю. П. Морфологический анализ изображений // Докл. АН СССР. Т. 269, № 5. М.: УРСС, 1983. 1061 с.
  75. П. К. Курс дифференциальной геометрии М.: УРСС, 2003. -428 с.
  76. Стокман Джордж, Шапиро Линда Компьютерное зрение М.: Бином. Лаборатория знаний, 2006. — 752 с.
  77. В. В., Филиппов В. В. Общая топология. Основные конструкции М.: Издательство Московского Университета, 1988. — 251 с.
  78. Форсайт Дэвид А., Понс Джин Компьютерное зрение. Современный подход М.: Вильяме, 2004. — 928 с.
  79. Чен Ш. К. Принципы проектирования систем визуальной информации — М.: Мир, 1994.
  80. А. Н. Вероятность М.: Наука, 1989 — 638 с.
  81. Blum Н. A transformation for extracting new descriptors of shape // Models for the Perception of Speech and Visual Form, MIT Press, 1967.8 7 6 5 4 3 2 1
  82. Аи/е- /ч/ю* нми/г-чоЯ» ими г- чооо^ лниме-зю* нмшг-воо"-/7/?/ г гс//г и. НО /ГСМР! Нхг>пе-*> НОРУ Р 4 <
  83. У н/чп/ег-ЯСОх /440* дуи-дал^л-, «, ео Ими//. /440'* рмш/- гччо* нмш/ -/чча~ ШЧ' .иу ¦ .вг УАК-вБ^ «¦/А/7ЛРР ч<�ипР<*, кме/г- 4гхо //мл/г-гвос пчо НМШЗ-':<№)* кБл^а/-^1. К/ «•И/ иг
  84. ЧА&Ь'Г^ УД, Г?/7 С 9А' ЧАРУР<*~ О НССРць,6 елш> н/ги/мг-зго н /»?улгг-зго нлпгу^г-эге. «/"ШЬ-ШОО мг-?о/М1 -//го НМШ1- /440 иу и? •X/
Заполнить форму текущей работой