Диссертация на тему "Разработка и исследование методов и алгоритмов нечеткой классификации объектов имиджей документов", скачать бесплатно автореферат по специальности 05.13.17

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. АНАЛИЗ СОВРЕМЕННОГО СОСТОЯНИЯ В ОБЛАСТИ ОБРАБОТКИ ИМИДЖЕЙ ДОКУМЕНТОВ
1.1. Анализ существующих походов сегментации имиджей документов
1.2.Систематизация методов классификации и кластеризации объектов имиджа
1.3. Методы классификации с обучением по прецедентам..™
1.4. Выводы по разделу
2. РАЗРАБОТКА ОПИСАНИЙ ОБЪЕКТО-СЕГМЕНТИРОВАННОЙ ИМИДЖИНГОВОЙ МОДЕЛИ ДОКУМЕНТА И ЭТАЛОННЫХ КЛАССОВ
2.1. Анализ признаков классификации для построения объектосегментированного имиджингового представления документа и выбор математического аппарата исследований
2.2. Разработка объекто-сегментированной имиджинговой модели представления документа
2.3. Разработка эталонного класса для объекто-сегментированной имиджинговой модели представления документа
2.4. Общий подход к построению классификатора объектосегментированного имиджингового документа
2.5. Выводы
3. РАЗРАБОТКА МЕТОДА КЛАССИФИКАЦИИ ОБЪЕКТОВ ИМИДЖЕЙ ДОКУМЕНТОВ
3.1. Выбор модели классифицирующей функции
3.2. Разработка методов анализа объектов имиджей документов по основным признакам классификации
3.3. Формирование признаков эталонных классов

3.4. Разработка вида классифицирующих функций
3.5. Выделение символов и слов в текстовых блоках имиджей документов
3.6. Разработка алгоритма нормализации графического символа
3.7. Комбинированное использование методов распознавания символов
3.8. Выводы
4. ЭКСПЕРИМЕНТАЛЬНОЕ ИССЛЕДОВАНИЕ МЕТОДОВ АНАЛИЗОВ
И КЛАССИФИКАЦИИ ОБЪЕКТОВ ИМИДЖЕЙ ДОКУМЕНТОВ
4.1. Структура программного комплекса для моделирования нечеткой классификации объектов имиджей документов
4.2. Разработка и исследование алгоритма поиска оптимальных коэффициентов для основных признаков
4.3. Экспериментальное исследование точности нечеткой классификации объектов имиджей в зависимости от числа сегментов имиджа
4.4. Экспериментальное исследование комбинации методов распознавания символов
4.5. Вывод
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ПРИЛОЖЕНИЯ
ПРИЛОЖЕНИЕ 1. Алгоритмы для анализа основных признаков
ПРИЛОЖЕНИЕ 2. Статистические данные вычисления по каждому
признаку
ПРИЛОЖЕНИЕ 3. Статистические данные результатов распознавания,
отсортированные по величине количества ошибки
ПРИЛОЖЕНИЕ 4. Алгоритм определения краев между объектами

ВВЕДЕНИЕ
Актуальность темы
В настоящее время в связи с развитием глобальных информационных коммуникаций все большее значение приобретает доступ к информации, представленной в электронном виде. В связи с этим большое значение придается созданию различного рода информационных архивов, в том числе и таких как электронные библиотеки. Однако, накопленные человечеством объемы бумажной информации настолько велики, что их перевод в электронные аналоги требует разработки специальных информационных технологий, в противном случае проблема может быть не решаемая.
При компьютерной обработке бумажного документа для получения его электронного аналога выделяют следующие этапы. Вначале бумажный документ сканируется, в результате чего получается электронная копия документа виде цифровой фотографии - имиджа (image). Далее имидж обрабатывается для получения нужных параметров его качества. Улучшение имиджа включает программное выравнивание, конвертирование с улучшением качества, удаление шумовых и фоновых элементов, нормализацию и пр. Данный процесс в компьютерной обработке называют имиджингом (imaging). Иначе говоря, имиджинг - это процесс получения аутентичных качественных изображений бумажных документов. В компьютерную обработку термин имиджинг пришел из микрофильмирования, однако сегодня он широко используется применительно к электронным изображениям. Имиджинг является начальным этапом в работе любой системы компьютерной обработки бумажных документов [35, 36, 70].
Очевидно, что с имиджами документов гораздо удобнее работать в сравнении с бумажными документами. Их можно копировать, накапливать в архивах, отправлять по компьютерной сети и т.д. Однако имидж нельзя редактировать, осуществлять по нему контекстный поиск, поскольку он является целостным и нерасчленимым на отдельные составляющие. Поэтому

Табличное объекто-имимджинговое описание документа, представленного на Рис, 2.3 имеет следующий вид.
Таблица 1.2. Табличное объекто-сегментированное описание имиджа рисунка.
ОгарЬ(я)
Распределение цветов Число отдельных объектов Число вертикальных линий Число горизонтальных линий
с/у = 212 с12= 10437.06 О II 3 = 0
ч с9 Ч/ Г/ С9- Ч,/ 7/3 С9 Ч,] гр 4 7 С9 Ч
текст или таблица 0.00 текст 0.00 текст, рисунок или таблица 0.16 текст или рисунок
рисунок 1.00
рисунок 1.00 таблица 0.00 таблица
Пример 3. Рассмотрим пример построения объекто-сегментированного описания имиджа таблицы, которое приведен на Рис. 2.4.

Название работы	Автор	Дата защиты
Матрично-векторные уравнения локального апостериорного вывода в алгебраических байесовских сетях	Золотин, Андрей Алексеевич	2018
Построение и исследование артикуляторных кодовых книг для решения речевых обратных задач	Макаров, Илья Сергеевич	2005
Анализ показателей эффективности функционирования телекоммуникационных систем с вероятностным приоритетом обслуживания и пороговым управлением нагрузкой	Милованова, Татьяна Александровна	2013

Электронная библиотека диссертаций

Разработка и исследование методов и алгоритмов нечеткой классификации объектов имиджей документов

Рекомендуемые диссертации данного раздела