Исследование, развитие и реализация методов автоматического распознавания рукописных текстов в компьютерных системах

Исследование, развитие и реализация методов автоматического распознавания рукописных текстов в компьютерных системах

Автор: Ян, Давид Евгеньевич

Количество страниц: 179 с. ил

Артикул: 2332926

Автор: Ян, Давид Евгеньевич

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2003

Место защиты: Москва

Стоимость: 250 руб.

Оглавление
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ ПРОБЛЕМЫ.
1.1 Структуризация задачи автоматизированного ввода рукописных документов.
1.2 Роль распознавания одиночного символа в задаче ввода рукописных
документов
1.3 Выводы.
ГЛАВА 2. ОБЗОР ЛИТЕРАТУРЫ
2.1 Предварительная обработка изображения символа
2.2 Вычисление призуаков.
2.3 Построение классификатора
2.4 Структурное распознавание
2.5 Комбинирование распознавателей.
2.6 Выводы.
ГЛАВА 3. РЕШЕНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ.
3.1 Постановка задачи
3.2 Принцип целостности, целенаправленности и использования контекста
3.3 Метод целостного, целенаправленного многоуровневого применения
растрового, признаковых и структурного классификаторов
3.4 Векторное изображение
3.5 Приведение изображений для классификаторов.
3.6 Выводы
ГЛАВА 4. ПРИЗНАКОВЫЕ МОДЕЛИ РАСПОЗНАВАЕМОГО ОБЪЕКТА.
4.1 Признаки на растровом изображении
4.2 Признаки на векторном изображении
4.3 Описание признакового классификатора.
4.4 Дифференциальные признаковые эталоны.
4.5 Выводы.
ГЛАВА 5. СТРУКТУРНАЯ МОДЕЛЬ РАСПОЗНАВАЕМОГО ОБЪЕКТА.
5.1 Общая схема работы структурного классификатора.
5.2 Описание структурных элементов.
5.3 Выделение структурных элементов.
5.4 Сопоставление структурного эталона с изображением.
5.5 Методика разработки структурных описаний
5.6 Построение структурных описаний.
5.7 Базы изображений
5.8 Выводы
ГЛАВА 6. РЕЗУЛЬТАТЫ ИСПЫТАНИЙ
6.1 Испытания простого растрового классификатора
6.2 Испытания признакового классификатора на растре.
6.3 Испытания признакового классификатора на векторе
6.4 Испытания полной процедуры распознавания
6.5 Сравнение полученных результатов с результатами аналогичных систем
6.6 Выводы.
ГЛАВА 7. РЕАЛИЗОВАННЫЕ ПРОГРАММНЫЕ СИСТЕМЫ И ВНЕДРЕНИЯ .
7.1 Обзор реализованных программных систем.
7.2 Министерство образования. Единый государственный экзамен.
7.3 Центр тестирования Министерства образования РФ.
7.4 Пенсионный фонд России.
7.5 Министерство по Налогам и Сборам России
7.6 Федеральная Служба Налоговой Полиции России
7.7 Правительство Москвы.
7.8 Национальная Служба Новостей НСН.
7.9 Банковский сектор
7. Маркетинговое агентство СканМаркет
7. АО Каипо епеуа.
7. АДИДАС
7. Выводы
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Предложенный метод целостного, целенаправленного многоуровневого применения растрового, признаковых и структурного классификаторов для распознавания рукописных символов реализован в рамках программной системы «FormReader» и доведен до уровня промышленного использования в Министерстве образования РФ, в Центре тестирования Министерства образования РФ, Пенсионном фонде РФ, Министерстве по налогам и сборам России, Федеральной Службе налоговой полиции России, Правительстве Москвы, Сбербанке РФ, Национальной регистрационной компании, а также в ряде других государственных и коммерческих организаций. За данный цикл работ по исследованию, разработке и внедрению в отрасли экономики компьютерных технологий постановлением Правительства Российской Федерации от марта г. N 5 соискателю была присуждена премии Правительства Российской Федерации года в области науки и техники. Диссертация состоит из введения, семи глав, заключения и списка цитируемой литературы, включающего наименование. Диссертация изложена на 9 страницах машинописного текста, содержит рисунков и таблиц. Во введении обоснована актуальность темы диссертации, сформулированы ее цели, научная новизна и основные положения, выносимые на защиту. В первой главе дается общее описание проблемы автоматизированного ввода рукописных документов в компьютер. Показывается, что основным фактором, влияющим на эффективность и количество ошибок при распознавании всего документа, является точность распознавания одиночных символов. Во второй главе представлен обзор литературы по изучаемой проблеме, упорядоченный по основным направлениям исследований в области распознавания рукописных символов. Целенаправленно отобраны наиболее удачные предшествующие результаты и выявлены те направления исследований, в которых возможно добиться качественных улучшений за счет усовершенствования существующих и применения новых методов построения системы распознавания символов. Выделены пять основных подзадач для построения системы распознавания: выбор способа предварительной обработки изображения, выбор набора признаков для работы простого растрового и признаковых распознавателей, построение классификаторов, структурное распознавание и комбинирование распознавателей. В первом параграфе подробно излагается задача предобработки изображения, которая обычно выполняется до начала классификации. Задача предобработки ставится в диссертации в строгую зависимость от используемого классификатора, поскольку не существует оптимального метода предобработки вообще и, следовательно, оптимальность должна определяться по результатам работы классификатора. С другой стороны, необходимо учесть, что предобработка изображения всегда приводит к необратимой потере информации. Во втором параграфе описывается задача выбора признаков для работы растрового и признаковых классификаторов, а также обосновывается необходимость приведения набора признаков к оптимальному виду. В третьем параграфе дается представление о процедуре классификации, вводятся понятия «обучения» и «тестирования» классификатора, описываются наиболее часто используемые классификаторы, такие как: Байесовский классификатор, полиномиальный классификатор, многоуровневый персептрон, радиальные функции, классификация по ближайшему соседу, кластерный анализ. Четвертый параграф посвящен описанию структурного распознавания. Выделены два существенно разных подхода к построению структурных классификаторов. В пятом параграфе рассматривается комбинирование распознавателей разного типа. Такой подход хорошо зарекомендовал себя в решении классической задачи объединения результатов небольшого числа параллельно работающих классификаторов. Однако более сложные схемы объединения (последовательная, последовательно-параллельная) исследованы в значительно меньшей степени. Именно эти схемы и рассматриваются в последующих главах диссертации. В третьей главе дается содержательная постановка задачи распознавания одиночного символа, и излагаются новые подходы к решению проблемы классификации рукописных символов. Приводится развернутое описание разработанного метода распознавания, который базируется на целостном, целенаправленном поэтапном применении ряда классификаторов, в числе которых полные классификаторы (растровый, признаковый с признаками на растре, признаковый с признаками на векторе, структурный), и парные дифференциальные классификаторы. В первом и втором параграфах описана постановка задачи и фундаментальный принцип построения структурного классификатора - принцип целостности, целенаправленности и использования контекста.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.245, запросов: 244