Численные методы детектирования и исправления геометрических искажений в изображениях текстовых документов

Численные методы детектирования и исправления геометрических искажений в изображениях текстовых документов

Автор: Масалович, Антон Андреевич

Шифр специальности: 05.13.17

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Москва

Количество страниц: 133 с. ил.

Артикул: 4734739

Автор: Масалович, Антон Андреевич

Стоимость: 250 руб.

Численные методы детектирования и исправления геометрических искажений в изображениях текстовых документов  Численные методы детектирования и исправления геометрических искажений в изображениях текстовых документов 

Оглавление
Оглавление.
Введение.
1 Геометрические искажения в изображениях текстовых документов и проблема их исправления
1.1 Постановка задачи
1.1.1 Изображение документа
1.1.2 Т екст документа.
1.1.3 Предобработка и нормализация изображения документа.
1.1.4 Функция преобразования изображения.
1.1.5 Математическая постановка задачи распрямления строк текста
на изображении документа.
1.1.6 Оценка результата при исправлении искажений.
1.2 Анализ существующих решений
1.2.1 Выделение на изображении слов и строк текста.
1.2.2 Построение функции искажения вертикальных границ текста.
1.2.3 Построение функции деформации строк текста.
1.2.4 Общие замечания.
1.3 Структура предаваемого метода
1.4 Выводы по главе 1
2 Строковая сегментация и детектирование искажений в изображениях текстовых документов.
2.1 Непрерывное граничноскелетное представление изображения
2.1.1 Граница и скелет изображения.
2.1.2 Скелет полигональной области и его свойства
2.1.3 Скелетный граф полигональной области.
2.1.4 Внешний скелет изображения и его свойства.
2.2 Сегментация изображения текста на основе внешнего скелета
2.2.1 Предобработка изображения.
2.2.2 Предобработка скелета.
2.3 Выделение межстрочных ветвей скелета.
2.3.1 Определение ветвей скелета и операций с ними
2.3.2 Кластеризация ребер скелета.
2.4 Постобработка скелета
2.5 Сегментация отдельных строк текста.
2.6 Аппроксимация строк документа
2.6.1 Построение аппроксимации ломаной линии кривой Безье
2.6.2 Аппроксимации строк текста кривыми Бсзьс
2.7 Итерационная подгонка аппроксимации
2.7.1 Общее описание метода итерационной подгонки кривой
2.7.2 Нахождение ближайшей точки на кривой
2.7.3 Доказательство сходимости метода подгонки.
2.8 Выводы по главе 2
3 Исправление геометрических искажений на основе аппроксимации их двухмерными патчами Безье
3.1 Использование метода аппроксимации в работе7
3.2 Изменение параметризации кривой Безье
3.2.1 Постановка задачи.
3.2.2 Растяжение параметров кривой Безье
3.2.3 Сдвиг параметров кривой Безье.
3.3 Построение двумерного патча Безье на основе набора
одномерных кривых
3.3.1 Постановка задачи.
3.3.2 Метод аппроксимации семейства кривых патчем Безье.
3.3.3 Аппроксимация набора кривых Безье по опорным точкам.
3.3.4 Метод итерационной подгонки патча Безье.
3.4 Исправление геометрических искажений на изображении текста
3.4.1 Общая процедура построения распрямленного изображения
3.4.2 Определение цвета пикселя
3.5 Выводы по главе 3.
4 Программный комплекс и вычислительные эксперименты
4.1 Программная реализация алгоритма
4.1.1 Основные функции программной реализации
4.1.2 Описание программной реализации
4.1.3 Шаги алгоритма.
4.1.4 Описание пунктов меню в главном окне.
4.2 Результаты экспериментов
4.2.1 Основной эксперимент.
4.2.2 Резул ьтаты эксг геримента.
4.2.3 Сравнение с мировым уровнем
4.3 Выводы по главе 4.
Заключение
Список литературы


Поэтому в последнее время очень большое внимание уделяется методам, позволяющим устранять геометрические искажения в изображениях документов. В частности, в рамках самой крупной международной конференции по анализу и распознаванию документов ICDAR (International Conference on Document Analysis and Recognition) проводилось сравнительное тестирование методов распрямления текстовых строк на изображениях документов []. Также в рамках тестирования впервые была сформирована большая общедоступная база документов с геометрическими искажениями []. Создание такой базы позволяет легко сравнивать между собой различные метода распрямления текстовых строк на изображении. Однако, несмотря на возросший интерес к этой области и наличие большого количества новых методов устранения геометрических искажений ([-]), универсального метода для решения этой проблемы, который бы с одинаковой эффективноегыо устранял искажения на любых типах текстовых изображений, не было изобрегено. Таким образом, задача устранения геометрических искажений в изображениях текстовых документов являегся весьма актуальной и нуждается в разработке эффективных методов решения с использованием новых идей. Целью настоящей работы является создание метода аппроксимации и устранения сложных разнообразных геометрических искажений на изображениях документов для повышения качества их распознавания. Сложность данной задачи определяется трудностями детектирования и формального описания разнообразных искажений текстовых документов, необходимостью построения универсального алгоритма коррекции документов, трудностью выбора критерия качества для решения поставленной задачи. В практическом аспекте целью работы является создание программного комплекса для устранения геометрических искажений текстовых документов. Предлагаемый подход к решению задачи основывается на двух новых идеях. Первая идея относится к подзадаче выявления строковой структуры изображения. Предлагается осуществить сегментирование строк изображения путём выявления междустрочных просветов на основе построения и анализа внешнего скелета изображения текста в документе. Вторая идея относится к выбору вида геометрического преобразования изображения. Предлагаемый подход состоит в описании искажения в виде двумерного патча Безье. Эта модель обеспечивает большую гибкость настройки на различные типы сложных искажений. Научная задача работы состоит в создании метода геометрических преобразований изображений текстовых документов на основе аппроксимации междустрочных просветов с помощью одномерных кривых Безье и общего преобразования изображения в виде двумерного патча Безье. На защиту выносятся следующие положения. Математическая модель описания искажений в виде непрерывной функции преобразования координат, представленной двухмерным патчем Безье. Метод детектирования междустрочных просветов текста на основе «непрерывного» внешнего скелета изображения текстовых блоков. Метод сегментации строк текста в изображении на основе найденных междустрочных просветов. Метод аппроксимации междустрочных просветов и строк текста кубическими кривыми Безье. Метод аппроксимации искажения всего документа с помощью двумерного паша Безье по набору одномерных кривых Безье, аппроксимирующих искривления отдельных междустрочных просветов. Метод итерационной подгонки аппроксимирующего патча Безье. Метод распрямления изображения документа на основе аппроксимации искажения документа. Разработала вычислительная схема построения аппроксимирующего двумерного патча Безье на основе вычисления одномерных аппроксимирующих кривых Безье для междустрочных просветов и дальнейшей итерационной подгонки патча Безье. Научная значимость работы состоит в описании геометрических искажений в изображениях текстовых документов с помощью математической модели двумерного патча Безье, а также в разработке метода параметрической настройки этой модели для конкретных данных. Практическая значимость состоит в создании и реализации нового метода аппроксимации и удаления геометрических искажений в изображениях текстовых документов, обеспечивающего существенное повышение качества автоматического распознавания текстов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.211, запросов: 244