Обработка и распознавание рукописного текста в системах электронного документооборота

Обработка и распознавание рукописного текста в системах электронного документооборота

Автор: Горошкин, Антон Николаевич

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Красноярск

Количество страниц: 107 с. ил.

Артикул: 4179362

Автор: Горошкин, Антон Николаевич

Стоимость: 250 руб.

Обработка и распознавание рукописного текста в системах электронного документооборота  Обработка и распознавание рукописного текста в системах электронного документооборота 

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
Глава 1. Анализ методов и систем обработки и распознавания рукописных символов и текста
1.1 Классификация существующих методов обработки изображений рукописных документов.
1.1.1 Предварительная обработка изображений.
1.1.2 Сегментация изображений рукописных документов
1.2 Сравнительный анализ подходов к распознаванию рукописных символов и текста
1.2.1 Распознавание рукописных символов в пассивном режиме.
1.2.2 Распознавание рукописного текста.
1.3 Анализ существующих систем распознавания рукописных символов и текста
1.4 Выводы по главе
Глава 2. Построение моделей сегментации и распознавания рукописных символов и текста в пассивном режиме.
2.1 Метод обнаружения информативных зон на изображении.
2.2 Метод сегментации изображений текстовых зон на отдельные символы
2.3 Векторный подход к распознаванию рукописных символов.
2.3.1 Построение векторной модели
2.3.2 Преобразование векторной модели к инвариантному виду.
2.3.3 Распознавание рукописных символов на основе инвариантной
векторной модели.
2.4 Метод распознавания рукописного текста с использованием вероятностного подхода на основе лингвистической модели слова
2.4.1 Разработка лингвистической модели слова
2.4.2 Адаптивное построение дерева решений на основе вероятностного
подхода
2.5 Выводы по главе
Глава 3. Построение экспериментальной комплексной системы распознавания рукописного текста.
3.1 Структурная схема комплекса по распознаванию рукописного текста.
3.2 Описание основных модулей системы
3.3 Результаты экспериментальных исследований
3.4 Программа Модуль ввода данных
3.5 Выводы но главе
ЗАКЛЮЧЕНИЕ.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК.
ПРИЛОЖЕНИЕ
ВВЕДЕНИЕ
Актуальность


Усовершенствован метод сегментации изображений, содержащих рукописный текст, на отдельные текстовые зоны (строки и слова) на основе операций морфологической обработки и на отдельные символы с использованием процедуры адаптивной подстройки выделяющей ячейки и усиления ядра символов. Предложена векторная модель описания внешнего контура изображений рукописных символов, основанная на нахождении опорных точек с применением модифицированного фильтра Робертса, а также алгоритм построения модели на основе процедур уплотнения и нормализации параметров векторного представления. Разработан алгоритм распознавания рукописных символов, использующий базу эталонных векторных описаний с обучением и без обучения на конкретный почерк, и распознавания текста с использованием тематических электронных словарей. Практическая значимость. Предложенные в диссертационной работе методы и алгоритмы предназначены для практического применения в системах документооборота предприятий, анкетирования населения, паспортно-визовой службы и других систем, где входными данными являются изображения текста, написанного от руки. Реализация результатов работы. Разработанная программа «Система векторизации и распознавания внешнего контура изображений рукописных символов (УесЮгухаиэг)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 7 июня г. Сегментация изображений рукописного текста (SegPic)» зарегистрирована в Российском реестре программ для ЭВМ г. Москва, 5 сентября г. Разработанные алгоритмы и программное обеспечение используются в учебном процессе при проведении занятий по дисциплинам «Интеллектуальная обработка данных», «Теоретические основы цифровой обработки изображений» в Сибирском государственном аэрокосмическом университете им. М. Ф. Решетнева (СибГАУ), а также в программном комплексе по обработке результатов социологических исследований «Социорасчет» социологической лаборатории СибГАУ. Метод сегментации изображений рукописного текста на отдельные текстовые зоны и символы на основе морфологической обработки и процедуры адаптивной подстройки выделяющей ячейки. Векторная модель описания внешнего контура изображений рукописных символов, основанная на нахождении опорных точек, а также алгоритм построения данной модели. Алгоритм распознавания рукописных символов и текста на основе векторного подхода с использованием тематических словарей. Апробация работы. Основные положения и результаты диссертации докладывались и обсуждались на -й международной конференции и выставке «Цифровая обработка сигналов и ее применение» (Москва г. IX международной научно-технической конференции «Кибернетика и высокие технологии XXI века» (Воронеж г. Модели и методы обработки изображений» (Красноярск г. Решетневские чтения» (Красноярск , , , гг. Наука. Технологии. Инновации» (Новосибирск г. Ы1арад-» (Красноярск г. Актуальные проблемы авиации и космонавтики» (Красноярск , , гг. Летней школы компании «Интел» (Москва, Нижний Новгород г. СибГАУ. Публикации. По результатам диссертационного исследования опубликовано печатных работ, из них 4 статьи, тезисов докладов, 2 свидетельства, зарегистрированных в Российском реестре программ для ЭВМ. Структура работы. Работа состоит из введения, трех глав, заключения, списка литературы и приложения. Глава 1. В данной главе представлен обзор методов, применяемых для обработки и распознавания рукописных документов, как в интерактивном, так и пассивном режимах. Также достаточно подробно рассмотрены основные функциональные возможности существующих систем распознавания. При решении задачи распознавания рукописных символов и текста важным этапом является предварительная обработка изображений документов, которая включает процедуры бинаризации, выделения границ, построение скелета изображения, а также морфологические методы расширения и сжатия [, , , , , , 1]. Известны ряд методов приведения изображения к бинарному виду, а именно, метод пороговой бинаризации, метод бинаризации по площади, метод преобразования на основе анализа гистограммы распределения яркости элементов изображения [, -, ]. В случае использования двух первых методов для каждого элемента изображения, являющегося центром некоторой окрестности, вычисляется среднее и дисперсия по этой окрестности.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.241, запросов: 244