Разработка и исследование методов распознавания рукописных арабских текстов

Разработка и исследование методов распознавания рукописных арабских текстов

Автор: Салюм Саид Салех

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2003

Место защиты: Ижевск

Количество страниц: 127 с. ил.

Артикул: 2617999

Автор: Салюм Саид Салех

Стоимость: 250 руб.

1.1. Элементы грамматики арабского языка в свете задач распознавания
1.2. Основные этапы распознавания и подходы к их решению.
1.3. Сопоставление задач распознавания арабского и русского текстов
1.4. Интерактивные системы распознавания.
1.5. Автономные системы распознавания
1.6. Выводы по первой главе и постановка задачи исследования.
Г л а в а 2. АЛГОРИТМЫ ВЫДЕЛЕНИЯ СКЕЛЕТА ШРИФТА
2.1. Подготовка изображения
2.2. Выделение скелета.
2.3. Определение ширины фонта
2.4. Конфигурация строк
2.5. Сегмаггация знаков
2.6. Выводы по второй главе
Г л а в а 3. АЛГОРИТМЫ РАСПОЗНАВАНИЯ.
3.1. Объекты арабского текста и карта строки.
3.2. Распознавание знаков
3.3. Распознавание символов
3.3.1. Граф символа
3.3.2. Метод циркуляционной нумерации
3.3.3. Сектор относительного положения.
3.3.4. Ширина линии
3.3.5. Т ип соединения.
3.3.6. Пример распознавания символа
3.4. Распознавание слов в
3.5. Выводы по третьей главе.
Г л а в а 4. СИСТЕМА РАСПОЗНАВАНИЯ И БАЗЫ ДАННЫХ
4.1. Описание программы.
4.2. Структура базы данных.
4.3. Анализ результатов распознавания
4.4. Испытания системы распознавания.
4.4.1. Распознавание знаков
4.4.2. Арабский текст
4.4.3. Русский текст
4.4.4. Китайский текст аааааааааааааааааааааааааааааааааааааа
4.4.5. Линейные рисунки
4.4.6. Скорость распознавания
4.5. Выводы по четвертой главе.
ЗАКЛЮЧЕНИЕ
ВВЕДЕНИЕ


Теоретические исследования выполнены с использованием теории множеств, математической логики, теории распознавания образов. Экспериментальные исследования выполнены с помощью разработанной программной системы и некоторых известных продуктов на реальных арабских и русских текстах, иероглифах китайского языка, а также реальных и искусственных рисунках. Научная новизна. Метод утончения участков объекта, отличающийся тем, что с целью повышения качества скелетных линий в бинарное изображение введено понятие неопределенного цвета и, с целью повышения надежности распознавания текстов вычисление параметра ширины исходных линий. Модель текста в виде плоского графа, отображающего топологию, геометрические параметры и взаимосвязи символов, знаков, специфических элементов синтаксиса языка и методика формирования извлечения из изображения этой модели. Практическая ценность. Разработанные методы выделения информативных признаков на изображениях текстов арабского языка, модели и методы их распознавания положены в основу программной системы ОСЯеас1ег, позволяющей обеспечить требуемую достоверность распознавания всех элементов арабских рукописных и машинописных текстов. Реализация результатов работы. Результаты диссертационной работы внедрены в Центральном департаменте вычислительной техники , Арабские эмираты для ввода с бумажных носителей в электронные хранилища рукописных и машинописных текстов, написанных арабским шрифтом. Апробация работы. Основные положения диссертационной работы докладывались на 3 международных конференциях на III Международной научнотехнической конференции мая, , Ижевск i, на IV Международной научнотехнической конференции февраля, Ижевск, . Публикации. По теме диссертации опубликовано 5 работ. Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений. Основной текст изложен на 0 машинописных страницах с таблицами и иллюстрациями. Список литературы включает 4 наименований. Г л а в 1. Арабский язык является самым древним языком, его история насчитывает более лет. За это время язык сильно изменился, однако последняя государственная реформа правописания арабского языка производилась около лет назад, и с тех пор мало что изменилось. В этой главе будет проведен анализ грамматических, графологических и алгоритмических особенностей распознавания арабских текстов. Рассмотрено правописание арабского языка, основные виды распознающих программ. Рассмотрены такие вопросы, как повышение надежности распознавания, в частности, когда лучше распознать слово целиком или по буквам после сегментации. Также в этой главе производится сравнение особенностей арабского и русского языков, дается обзор существующих методов распознавания текстоварабского языка. Арабский алфавит содержит букв, в отличие от славянских или латинских. Арабские буквы имеют один регистр, и, как известно, арабский язык пишется справа налево. В арабском языке буква изменяет свою форму в зависимости от ее места в слове в начале, в средине, или в конце. Большинство букв надо соединять с предыдущей и последующей буквой, а некоторые только с предыдущей буквой. В табл. I 6 Ii ii iiIi i ii. На рис. Университет. Напишем это слово с помощью i пятью шагами после каждого нажатия клавиши, шрифт i, размер . Видно как буквы поменяли свою форму в зависимости от прельщу щих и следующих букв. Отметим, что вторая буква соединялась только с правой стороны. Рис. Таблица 1. Продолжение табл. БНЫ и о о. ТТАА з и. ЭНАА и Ь. АТО . СНАУЧ . БАА 1 ск. КААБ Л Л. ЬААМ 1 а. НАА л Д а. На рис. Слово имеет только один вид, потому что заранее известно как буква будет соединена с другими буквами. Русское слово из одиннадцати букв Университет можно написать 4 разными способами это количество соединений между буквами. Тот факт, что арабские слова пишутся по одной форме, существенно уменьшает объем словаря, а это, в свою очередь, существенно улуч
шит качество распознавания. По историческим причинам форма некоторых букв отличается от ожидаемой при соединении с другими буквами. Приведем правила присоединений 1. Буква АЬШ I соединяется с буквой ЬААМ с согласно табл. Таблица 1.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.278, запросов: 244