Модели и алгоритмы распознавания железнодорожной технической документации

Модели и алгоритмы распознавания железнодорожной технической документации

Автор: Бурсиан, Елена Юрьевна

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Санкт-Петербург

Количество страниц: 155 с. ил.

Артикул: 4905684

Автор: Бурсиан, Елена Юрьевна

Стоимость: 250 руб.

Модели и алгоритмы распознавания железнодорожной технической документации  Модели и алгоритмы распознавания железнодорожной технической документации 

ВВЕДЕНИЕ .
Глава I. Структура изображения листа монтажной железнодорожной документации. Анализ технических средств распознавания документов и теоретических основ алгоритмов обработки изображения чертежей и текстовой информации
1.1 Структура и особенности изображения листа монтажной документации для систем железнодорожной автоматики.
1.2 Пакеты программ технического чтения.
1.3 Алгоритмы предварительной обработки изображения.
1.4 Теоретические основы алгоритмов распознавания.
1.5 Выводы и постановка задачи исследования.
Глава II. Предварительная обработка изображения листа монтажной документации с целыо удаления шумов и искажений
2.1 Перевод изображений технических железнодорожных документов в чрнобелую палитру без применения алгоритмов фильтрации
2.2 Устранение шумов перед переводом изображения в чернобелый вид.
2.3 Применение преобразования Уолша .
2.4 Устранение шумов с помощью вещественного косинуспреобразования и комплексного дискретного преобразования Фурье.
2.5 Удаление помех перед разграничением объекта и фона
2.6 Влияние качества фильтрации на последующую обработку изображения.
2.7 Выводы
Глава III. Распознавание таблиц железнодорожной документации
3.1 Распознавание таблиц при высоком качестве изображения.
3.2 Поиск горизонтальных и вертикальных линий для таблиц, построенных вручную.
3.3 Алгоритм поиска разрывов без наложения для горизонтальных линий
3.4 Алгоритм поиска разрывов с наложением.
3.5 Распознавание структуры таблицы монтажной документации для систем железнодорожной автоматики
3.6 Выводы
Глава IV. Модели процессов распознавания символов и распознавания таблицы монтажной документации для систем железнодорожной автоматики как целостной структуры
4.1 Особенности задачи распознавания символьной информации, представленной в таблицах ТЖД .
4.2 Выделение связных множеств и выдвижение гипотез о принадлежности рассматриваемых множеств к семейству изображений символов как модель процесса автоматической сегментации символов
внутри ячеек
4.3 Скелетизация множества
4.4 Граница множества и алгоритм обхода границы.
4.5 Алгоритмы построения скелетного графа символа для изображения высокого качества .
4.6 Алгоритм построения скелетного графа символа для изображения невысокого качества
4.7 Построение базы данных скелетных графов эталонных символов для монтажной документации систем железнодорожной автоматики
4.8 Проверка гипотезы о принадлежности распознаваемой области множеству символом и выбор символа с помощью базы данных
скелетных графов эталонных символов
4.9 Объединение символов, расположенных в ячейках таблицы, в слова и строки. Модель распознавания листа монтажной документации и представление распознанной информации в виде, соответствующем
структуре таблицы в целом
Выводы.
Глава V. Основные результаты исследования
Библиографический список
ПРИЛОЖЕНИЕ 1
ПРИЛОЖЕНИЕ 2 .
ПРИЛОЖЕНИЕ 3.
ПРИЛОЖЕНИЕ 4.
СПИСОК УСЛОВНЫХ СОКРАЩЕНИЙ И ОСНОВНЫЕ
ОБОЗНАЧЕНИЯ
Технические термины
ГЖД техническая железнодорожная документация.
ЛМД лист монтажной документации.
МДСЖА монтажная документация для систем железнодорожной автоматики.
ПССЖА принципиальная схема для систем железнодорожной автоматики. СКСЖА схема комплектации для систем железнодорожной автоматики. МКСЖА монтажная карточка для систем железнодорожной автоматики.
Математические обозначения
0п рп 0цп
ЗА V рп Мцгп
ИРпР полуплоскость, состоящая из точек плоскости, удалнных от точки Ру дальше, чем от точки Р1.
У многоугольник Вороного.
СХ г замкнутый круг радиуса г с центром в точке Х0.
скелет замкнутого ограниченного множества сЛ.
НА,В расстояние Хаусдорфа между двумя множествами А и В.
ВВЕДЕНИЕ


Дополнительная информация не всегда имеет чткую структуру и в электронной базе данных может быть представлена как второстепенная информация. Таким образом, при создании электронной базы данных необходимо, прежде всего, выявить на изображении главную таблицу. Характерные признаки и особенностям главной таблицы могут быть использованы при е идентификации. Ячейки таблицы состоят из нескольких строк, представляющих собой последовательности слов, состоящих в свою очередь из букв русского алфавита, цифр и специальных знаков. При этом строки не отделены друг от друга какимилибо линиями или знаками. В словах и строках ячеек закодированы типы приборов и их характеристики. На одном листе технической документации встречаются как символы, созданные вручную с помощью чертжных шрифтов, так и символы, напечатанные на принтере, при этом применяемые принтеры могут быть старого образца с низким качеством печати. Линии таблицы также могут создаваться как вручную, так и на принтере. Таким образом, отсканированные листы монтажной документации для систем железнодорожной автоматики делятся на электронные, ручные, электронноручные и выполненные на принтерах старого образна. Приложение 2. То есть рассматриваемые изображения в большинстве случаев имеют искажения и дефекты. Горизонтальные и вертикальные линии таблиц во многих схемах делятся на главные и второстепенные, отличающиеся по интенсивности цвета и толщине, что является дополнительной информацией при распознавании структуры таблицы. При этом линии таблиц МДСЖД, изображения которых созданы вручную, имеют прерывистый характер. В соответствии со сказанным следует предполагать, что структура изображения МДСЖД представляет собой совокупность двух элементов главной таблицы, распознавание которой имеет первостепенное значение, и дополнительных компонент, изображения которых могут принимать различные формы тексты без каких либо рамок, таблицы, схемы. Главная таблица, в отличие от компонент дополнительной информации, как правило, относится к одному из заранее известных типов таблиц. Таким образом, при выборе программных средств, применяемых для распознавания изображения технической железнодорожной документации, необходимо учитывать все вышерассмотренные особенности. В следующем разделе рассмотрим программные средства и условия возможности их практического использования для распознавания изображения монтажной документации. В связи со значительным прогрессом компьютерной техники, в частности, развитием сканирующего оборудования, увеличением диапазонов разрешения, контрастности и яркости, созданием процессоров нового поколения, ростом объмов памяти и скорости обращения к ней, развитием общей теории распознавания появились новые комплексы программ распознавания печатного и рукописного текстов, таблиц, схем и другой технической символики. Ведущими разработками в данной области и наиболее применяемыми в настоящее время являются пакеты программ оптического чтения текстов i и . Комплекс программ i применяегся главным образом для обработки печатного текста, набранного любым общедоступным шрифтом с высоким качеством печати и отсканированного с разрешением от 0 до 0 i. Данный пакет программ не требует дополнительных указаний о типе шрифта или обработанной выборки текста, напечатанного данным шрифтом. При этом в нм имеются средства настройки на соответствующие языки распознаваемых текстов и введения дополнительных словарей 2. Пакет программ содержит систему распознавания рукописных символов. В качестве основных принципов применяемых при проектировании рассматриваемого пакета компьютерных программ распознавания применяются принципы распознавания, предположительно используемые биологическими системами. Данные общие принципы распознавания в году были выдвинуты группой авторов, возглавляемых А. Л. Шамисом 2. В соответствии с принципом целостности, сформулированным в самом общем виде, объект, предъявляемый распознающей системе, анализируется ею. Таким образом, чтобы распознать объект следует определить все его основные составные элементы и проверить выполнение соответствующих отношений.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.242, запросов: 244