Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке

Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке

Автор: Хоанг Зянг

Шифр специальности: 05.13.12

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Санкт-Петербург

Количество страниц: 108 с. ил.

Артикул: 4242919

Автор: Хоанг Зянг

Стоимость: 250 руб.

Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке  Проектирование математического обеспечения для автоматизированной системы распознавания печатных документов на вьетнамском языке 

ВВЕДЕНИЕ
ГЛАВА 1. АНАЛИЗ ВЬЕТНАМСКОГО ЯЗЫКА НА ПРЕДМЕТ
РАСПОЗНАВАНИЯ ТЕКСТА.
ГЛАВА 2. ПОЛУЧЕНИЕ ЦИФРОВОГО ИЗОБРАЖЕНИЯ ИЗ ПЕЧАТНЫХ ДОКУМЕНТОВ И ПЕРВИЧНЫЕ ОБРАБОТКИ ИЗОБРАЖЕНИЯ.
2.1 Преимущество электронных документов по отношению к бумажным. Типы электронных документов
2.2 Процесс преобразования документов
2.3 Дискретизация входного документа.
2.4 Бинаризация
2.5 Связный компонент
2.5.1 Понятие связного компонента.
2.5.2 Алгоритм анализа связных компонентов изображения
2. 6 Подавление шумов
2.6.1 Удаление малых шумовых блоков.
2.6.2 Подавление шума с помощью морфологических операций
2.7 Выравнивание страницы
2. 7.1 Метод Байрда.
2.7.2.Метод Г ашизуме.
2.7.3.Метод Блумберга.
2.7.4.Метод Амина и Ву
2.7.5. Разработанный метод
ГЛАВА 3. СЕГМЕНТАЦИЯ БЛОКОВ ДОКУМЕНТА
3.1 Анализ основных методов сегментации
3.2 Динамическая локальная карта связи.
3.3 Анализ результатов применения алгоритма определения пороговых значений для многошкальной сегментации.
3. 4 Разработка алгоритма построения иерархического дерева сегментации.
3. 5 Идентификация текстовых блоков
ГЛАВА 4. ВЫДЕЛЕНИЕ СТРОК И СИМВОЛОВ ИЗ ИЗОБРАЖЕНИЯ. КЛАСТЕРИЗАЦИЯ СИМВОЛОВ.
4.1 Разбиение текстовых блоков на строки.
4.2 Извлечение символов из строки
4.2.1 Разделение связанных символов.
4.2.2 Объединение связных компонентов одного символа
4.2.3 Извлечение символов на базе распознавания.
4.2.4 Целостный подход
4.2.5 Разработанный метод.
ГЛАВА 5. РАЗРАБОТКА АЛГОРИТМОВ РАСПОЗНАВАНИЯ ВЬЕТНАМСКОГО ЯЗЫКА.
5.1 История развития оптического распознавания символов
5.2 Обзор по современным опубликованным методам распознавания символов.
5.2.1 Метод Пелега и Розенфелда.
5.2.2 Метод Наги и др
5.2.3 Метод Ли на основе скрытой Марковской модели
5.2.4 Распознавание символов на базе нейронных сетей
5.3 Разработанный метод
5.3.1. Рейтинговый подход.
5.3.2. Распознавание с помощью нейронных сетей
5.3.3. Комбинированный подход.
ГЛАВА 6. ПРАКТИЧЕСКАЯ РЕАЛИЗАЦИЯ КОМПЛЕКСА МЕТОДОВ И
АЛГОРИТМОВ.
6.1 Обработка документа перед распознаванием.
6.1.1 Анализ компонентов
6.1.2 Определение блоков
6.1.3. Идентификация блоков.
6.1.4 Определения угла отклонения.
6.1.5 Извлечения строк из текстовых блоков
6.1.6 Извлечения символов из строк
6.2 Распознавание символов.
6.2.1 Распознавание с помощью рейтингового подхода
6.2.2 Распознавание с помощью нейронных сетей.
6.2.3. Комбинированный подход
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Искусственный интеллект - это (применительно к проблематике АП) научная дисциплина, развивающая теорию и средства решения на ЭВМ плохоформализуемых задач на основе оперирования неформальными знаниями человеком. Плохоформализуемые задачи - это чаще всего задачи в нечисловой форме. Работы в области ИИ ведутся по нескольким тесно связанным друг с другом направлениям: автоматическое доказательство теорем, распознание образов и сцен, обработка естественного языка, автоматическое программирование, планирование целесообразного поведения роботов, консультирующие экспертные системы и так далее. ИИ, находят или могут найти приложение в САПР. Среди них распознание образов является одним из развивающихся разделов ИИ и часто применяется для обработки входных данных для САПР. В данной работе основное внимание уделяется задаче оптического распознания образов, (англ. OCR - Optical Character Recognition) которая представляет собой процесс преобразования изображений (с помощью сканера, фотоаппарата, фотокамеры и т. Это преобразование дает большую пользу для коммерческих и жизненных целей. OCR является одним из исследовательских разделов распознавания образов, искусственного интеллекта и компьютерной визуализации. Состояние изученности проблемы. Хотя академическое исследование продолжается, в настоящее время большинство работ фокусируется на применения OCR в конкретные предметные области, поскольку нет общих алгоритмов для решения всех распознаваемых объектов. Каждый объект имеет свои характеристики и особенности. Кроме того, для распознавания одинакового объекта в различных условиях требуется разработка специальных алгоритмов для каждого случая. Например, алгоритмы, применяемые для выделения и распознавания печатного текста, будут плохо работать в задаче обнаружения и распознавания текста, появляющегося на экране телевизора. В настоящее время задача текстового распознавания (ТР) применяется во многих практических задачах, например - регистрация номеров автомобилей, автоматическая идентификация торговой марки, при разработке программного обеспечения (ПО) автоматического чтения текста для людей с ограниченным зрением и т. Применение ТР позволяет сохранить документ в электронном виде, что экономит пространство для архива, упрощает поиск нужного документа и т. Вместе с развитием теории распознавания образов и компьютерной технологии по времени появлялись более совершенные системы. OCR-системы уже успешно использовались для автоматической обработки выходящих писем, опечатки пальцы на кредитной карточки, формы для сбора информации о населении и т. С по -годам, оптическое распознавание символов непрерывно развивалось. Были разработаны более совершенные методы. Распознавание уже не просто сравнение символов с шаблоном. Появились статистические и синтаксические методы. В статистических методах сначала система обучается большим количеством изображений символов разных шрифтов и размеров. Особенности (признаки) этих изображений комбинируются и сохраняются, чтобы создать шаблоны символов в базе данных. Потом в фазе распознавания изображение символа сравнивается с шаблонами для нахождения соответственного символа. Синтаксические методы используются как вторичная обработка или коррекция результата распознавания другими способами для повышения эффективности системы. Эти методы реализуются путем сбора информации о частоте присутствия одного символа после другого при обработке текста большого объема. Эти символьные диаграммы могут расширяться, вместо одного символа рассматриваются комбинации 3-4 символов или целое слово. К сожалению этот подход ограничен вычислительной возможностью компьютера. В середине -годов на базе этих развитий создана OCR-система “Omnifont”, которая может распознавать символы разных шрифтов и размеров с высокой точностыо[6],[9]. Алгоритмы оптического распознавания символов (англ. OCR) алгоритмы постоянно развиваются и совершенствуются. В настоящий момент для некоторых языков, например английского, французского, русского, уже разработаны алгоритмы, распознающие печатные тексты с высокой эффективностью [1],[8].

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.208, запросов: 244