Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой

Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой

Автор: Зотин, Александр Геннадьевич

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Красноярск

Количество страниц: 135 с. ил.

Артикул: 3399758

Автор: Зотин, Александр Геннадьевич

Стоимость: 250 руб.

Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой  Методы и алгоритмы обнаружения наложенных текстовых символов в системах распознавания изображений со сложной фоновой структурой 

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР СУЩЕСТВУЮЩИХ МЕТОДОВ И СИСТЕМ РАСПОЗНАВАНИЯ ПЕЧАТНЫХ ТЕКСТОВЫХ СИМВОЛОВ
1.1 Общая характеристика подходов к распознаванию печатных текстовых символов
1.1.1 Сравнение шрифтовых и шрифтонезависимых подходов
1.1.2 Анализ структуры кириллического и латинского алфавитов
1.1.3 Классификация шумов при распознавании текстовой информации.
1.2 Технологии обработки и распознавания печатных текстовых символов.
1.2.1 Анализ цветовых моделей.
1.2.2 Улучшение качества изображений
1.2.3 Сегментация изображений.
1.2.4 Применение нейронных сетей для распознавания текстовой информации.
1.3 Анализ существующего программного обеспечения распознавания печатных символов
1.4 Выводы
ГЛАВА 2 РАЗРАБОТКА МЕТОДОВ И АЛГОРИТМОВ ОБНАРУЖЕНИЯ НАЛОЖЕННЫХ ТЕКСТОВЫХ СИМВОЛОВ.
2.1 Предварительная обработка изображения.
2.1.1 Обработка изображения во временной области
2.1.2 Адаптивная пространственная обработка изображения.
2.2 Сегментация изображений.
2.2.1 Цветовое адаптивное преобразование изображения
2.2.2 Формирование контурного представления изображения.
2.2.3 Выделение объектов представления изображения
2.3 Постобработка масочного представления изображений.
2.3.1 Первичная обработка масочного представления изображения.
2.3.2 Вторичная обработка масочного представления изображения.
2.4 Формирование образов текстовых символов
2.4.1 Формирование контурного представления с реконструкцией
2.4.2 Формирование образов текстовых символов.
2.5 Выводы.
ГЛАВА 3 ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ.
3.1 Функционирование системы распознавания наложенных текстовых символов на изображениях со сложной фоновой структурой.
3.2 Экспериментальное исследование алгоритмов обработки изображения
3.3 Экспериментальное исследование алгоритмов формирования текстовых зон.
3.4 Исследование качества распознавания образов текстовых символов
3.5 Выводы
ЗАКЛЮЧЕНИЕ
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
ПРИЛОЖЕНИЕ 1. Акт об использовании материалов диссертационной
ПРИЛОЖЕНИЕ 2. Примеры обработки текстовых зон различными
фильтрами.
ПРИЛОЖЕНИЕ 3. Примеры формирования цветового представления изображений.
ВВЕДЕНИЕ
Актуальность


Также существует потребность в системах распознавания печатных текстовых символов и в специализированных сферах деятельности. Ярким примером может служить охранная сфера деятельности, где возникает потребность распознавания номерных знаков транспортных средств, пересекающих контрольно-пропускные пункты в реальном режиме времени. Также одними из недавно появившихся применений (с -х гг. XX в. Отметим, что почти бесконечное разнообразие печатной продукции изготавливается при помощи ограниченного набора оригиналов символов, которые группируются по стилю (набору художественных решений). Группа оригиналов символов, включающая все алфавитные знаки, цифры и стандартный набор служебных символов, называется гарнитурой. Однако часто используется другое ассоциативное название гарнитуры - шрифт. Поскольку шрифт является основным атрибутом печатных текстов, он является основой для классификации существующих методов распознавания печатных символов. Известны два базовых решения: шрифтовый {multifont) и шрифтонезависимый (omnifont) подходы. В случае шрифтовых алгоритмов растровое изображение накладывается на шаблон и, соответственно, наиболее подходящим шаблоном является тот, у которого наименьшее количество точек отличается от исследуемого изображения. В свою очередь шрифтонезависимые алгоритмы идентифицируют символ по правилам его написания. В этом случае эталон, с которым производится сравнение, содержит в себе эвристическую информацию о правилах написания символа. Шрифтовые или шрифтозависимые подходы используют априорную информацию о шрифте, которым напечатаны символы. Это означает, что ОРС-системе должна быть предъявлена полноценная выборка текста, напечатанного данным шрифтом. Программа измеряет и анализирует различные характеристики шрифта и заносит их в свою базу эталонных характеристик. По окончании этого процесса ОРС-система, использующая шрифтовые алгоритмы, готова к распознаванию конкретного шрифта. К недостаткам данного подхода можно отнести следующее: алгоритм должен заранее знать шрифт, который ему предоставляют для распознавания, т. В связи с этим для работы программы распознавания необходим блок настройки на конкретный шрифт. Качество распознавания текста, напечатанного произвольным шрифтом, будет прямо пропорционально корреляции характеристик этого шрифта с характеристиками шрифтов, имеющимися в базе эталонов. Таким образом, данный фактор ограничивает универсальность таких алгоритмов и увеличивает ресурсоёмкость в связи с необходимостью хранения большого количества эталонов. С другой стороны, у шрифтового подхода имеется преимущество, благодаря которому его активно используют. Оно заключается в том, что, имея детальную априорную информацию о символах, можно построить весьма точные и надежные алгоритмы распознавания. В общем случае при построении шрифтового алгоритма распознавания надежность распознавания символа является интуитивно ясной и математически точно выразимой величиной. Эта величина определяется как расстояние в каком-либо метрическом пространстве от эталонного образа символа, предъявленного программе в процессе обучения, до образа символа, который программа пытается распознать. Использование множества эталонов одного конкретного по значению образа символа также повышает степень распознавания в случае незначительного искажения фрагмента распознаваемого образа, иными словами шрифтозависимые алгоритмы обладают хорошей помехоустойчивостью. Шрифтонезависимые подходы не обладают априорными знаниями о символах, поступающих к ним на вход. Алгоритмы, основанные на шрифтонезависимом подходе, измеряют и анализируют различные характеристики (признаки), присущие буквам как таковым безотносительно шрифта и абсолютного размера (кегля), которым они напечатаны []. В предельном случае для шрифтонезависимого алгоритма процесс обучения может отсутствовать. В этом случае характеристики символов измеряет, кодирует и помещает в базу эталонов программы сам человек. Однако на практике, случаи, когда такой путь исчерпывающе решает поставленную задачу, встречаются редко.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 1.028, запросов: 244