Моделирование систем распознавания изображений : На примере печатных текстов

Моделирование систем распознавания изображений : На примере печатных текстов

Автор: Абрамов, Евгений Сергеевич

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Санкт-Петербург

Количество страниц: 140 с. ил.

Артикул: 3010533

Автор: Абрамов, Евгений Сергеевич

Стоимость: 250 руб.

Моделирование систем распознавания изображений : На примере печатных текстов  Моделирование систем распознавания изображений : На примере печатных текстов 

Введение
Задачи, решаемые при помощи ЭВМ. В течение последних ти лет вычислительная техника развивалась стремительными темпами. Это развитие состояло как в увеличении производительности вычислительных машин, так и в уменьшении их размеров. В настоящее время персональный компьютер значительно превосходит по производительности суперкомпьютер хх годов го века.
Рост производительности вычислительных машин и увеличение объемов носителей информации сделали возможным решение при помощи ЭВМ широкого класса задач, связанных с цифровой обработкой данных. Например, персональный компьютер сейчас способен хранить и обрабатывать изображения, звук, видео, а ведь всего лет назад об этом можно было только мечтать.
Казалось бы, что современные компьютеры становятся все умнее, и сейчас они могут решать те задачи, которые еще недавно были им не под силу. Однако, имеются задачи, которые не могут быть решены с использованием ЭВМ и сейчас.
Существует два типа задач, которые не решаются при помощи ЭВМ.
Вопервых, это задачи, которые имеют алгоритм решения, но этот алгоритм не может быть реализован с достаточной степенью эффективности на современной вычислительной машине. Такие задачи могут быть решены, например, при помощи параллельных вычислений. В качестве примеров подобных задач можно привести задачу анализа генетической информации см., например, или задачу моделирования атмосферных явлений, описанную в .
Вовторых, существуют задачи, которые не имеют алгоритмического решения. Такие задачи не стали решаться лучше с ростом производительности вычислительных машин. Хорошим примером такого рода задач является задача создания искусственного интеллекта. Для того, чтобы решить эту задачу, необходимо знать, как действует интеллект человеческий, то есть необходимо разобраться в том, как работает человеческий мозг. Существует ли универсальный алгоритм, по которому он действует На этот вопрос мы не можем ответить. Поэтому нам приходится руководствоваться догадками и предположениями о том, как действует человеческий разум для того, чтобы попытаться смоделировать его работу.
ЭВМ и распознавание образов. Одной из характеристик живой материи является се способность воспринимать информацию и адекватно на нее реагировать. Иначе говоря, живые организмы способны распознавать различные образы. Эта способность присуща всем формам жизни и является необходимой для выживания любого организма. В настоящее время полное представление о способностях живых организмов к распознаванию
многих явлений и объектов отсутствуют. В то же время, создавая автоматизированные системы управления, человек высказывает гипотезы, продвигающие его к познанию устройства механизмов распознавания образов в природе, что позволяет успешно создавать распознающие системы .
Наиболее надежная распознающая система мозг человека. Человек может воспринимать новую для него информацию, анализировать ее, сопоставлять с тем, что он уже знает, и делать выводы на основе полученной информации. Машина же действует но заранее определенному, данному ей алгоритму, что делает невозможным ее адекватную реакцию на не предусмотренные этим алгоритмом ситуации. Можно написать сколь угодно сложную программу, но эта программа все равно не будет учитывать всего многообразия случайностей, которые могут встретиться в процессе ее работы.
Вполне возможно, что в основе разумной деятельности человека лежит некий вполне определенный, хотя и очень сложный алгоритм. Сейчас мы не можем сказать ничего определенного по поводу того, как работает человеческий мозг, а можем высказать лишь некоторые предположения.
Одно из главных отличий человека от любого компьютера состоит в том, что человек способен к индуктивному мышлению, т. е. способен делать выводы об общем, руководствуясь частным. Главным помощником человека в индуктивных построениях является его интуиция. Повидимому интуиция является некоторым скрытым от сознания человека методом анализа имеющейся информации, который позволяет выделять в ней скрытые за
кономерности, обобщать ее и высказывать гипотезы, которые с логической точки зрения, возможно, ничем не обоснованы.
Проводя какоето исследование, человек обычно начинает с эксперимента. Но даже поставив огромное количество опытов, нельзя полностью охватить все многообразие возможных ситуаций. Поэтому человек обобщает результаты конечного числа экспериментов и на основе этого обобщения высказывает гипотезу о закономерности поведения исследуемого объекта. Таким образом, в любой деятельности человека принятие решения происходит исходя из конечного числа наблюдений .
Длительное время вопросы распознавания образов рассматривались человеком лишь с позиций методов биологии и психологии. При этом целыо изучения являлись в основном качественные характеристики, не позволяющие вскрыть и точно описать соответствующий механизм. Если и получались числовые характеристики, то они, как правило, были связаны с изучением рецепторов, таких как органы зрения, слуха, осязания. Что же касалось характеристик принятия решений, то до их оценки дело не доходило. И только кибернетика позволила ввести в изучение психологического процесса распознавания образов, лежащего в основе принятия любых решений, количественные методы, что открыло принципиально новые возможности в исследовании и проектировании автоматических и автоматизированных систем распознавания образов .
Компьютерная обработка любой информации должна включать в себя обязательный этап программирование алгоритма обработки. Сейчас по
строение алгоритма и написание программы для компьютера это работа человека. Иными словами, для того чтобы научить машину решать некоторую задачу, человеку необходимо построить строго определенную последовательность действий, приводящую к решению этой задачи. Одной из главных проблем построения любого алгоритма является обеспечение адекватной реакции этого алгоритма на все многообразие возможных входных данных. В процессе решения задачи распознавания, число принимаемых решений но результатам распознавания конечно, в то время как число состояний внешней среды, оцениваемых в процессе самого распознавания и приводящих к указанным решениям, может быть бесконечным. Поэтому алгоритм распознавания должен уметь реагировать на бесконечное множество возможных состояний внешней среды. Построение такого алгоритма является одной из сложнейших задач теории распознавания образов.
Актуальность


Для машины же даже небольшое отклонение угла расположения текста, качества печати и начертания символов от заложенных в программу приведут к значительным отклонениям результатов распознавания от приемлемых. Поэтому нельзя сказать, что задача распознавания печатного текста решена. Актуальность решения этой задачи не вызывает сомнений поскольку обучение компьютеров чтению откроет возможность автоматизации таких процессов, как получение электронных копий различных документов и книг, поиск информации в бумажных источниках и т. Тематика данной работы. В данной работе рассматривается задача распознавания печатных текстов. Эта задача была выбрана по причине ее высокой практической ценности и актуальности. Можно сказать, что решение этой задачи выведет теорию распознавания образов на новый виток развития и позволит автоматизировать многие процессы управления. Кроме того, задача распознавания текста решалась в рамках проекта система распознавания текста с открытым кодом, разрабатываемого при поддержке фирмы ii i. Как и в любой другой научной дисциплине, в теории распознавания образов существуют различные подходы к рассматриваемой проблеме. Рассмотрим базовые идеи и концепции, приведшие к возникновению различных подходов к общей задаче распознавания образов. Всякое новое научное знание строится в терминах уже существующих теорий. Начальная точка этого процесса устанавливается общепринятыми, очевидными представлениями фактов аксиомами, которые не могут быть оспорены и поставлены под сомнение. Эти фундаментальные факты, тем не менее, могут быть различны для разных исследователей. Как следствие
этого могут появиться различные подходы к исследуемой проблеме и различные школы. В этом параграфе мы обсудим четыре подхода к распознаванию образов. Все они вытекают из двух противоположных философских подходов к построению процесса познания. Эти подходы можно представить как построение процесса познания от общего к частному подход Платона и от частного к общему подход Аристотеля . Подход Платона основывается на общепринятых концепциях и глобальных идеях о мировом устройстве. Первичной задачей исследователя, использующего этот подход является выявление в своих наблюдениях основополагающих концепций и идей. В подходе Аристотеля наблюдения ставятся на первый план. Научные описания строятся таким образом, чтобы максимально соответствовать этим наблюдениям. Наблюдения всегда являются фундаментом, от которого исследователь строит свое познание. Основная идея такого подхода выражается так следует избегать теорий, которые более сложны, чем требуется для объяснения наблюдений бритва Оккама. Нельзя сказать ничего определенного в пользу того или иного подхода к проведению исследований. Выбор подхода зависит исключительно от личных предпочтений исследователя. К недостаткам подхода Аристотеля можно отнести то, что исследователь не видит общей картины. С другой стороны используя подход Платона, ученые часто выдают желаемое за действительное. В этом параграфе мы будем пользоваться самым общим определением распознавания образов Распознавание образов это умение обобщать результаты наблюдений. Исследование в области распознавания образов может проходить путем самоанализа. Исследователь пытается понять, какие действия он предпринимает при решении задач распознавания. Такой подход, основанный на самоанализе, называется внутренним. Если исследователь изучает, как работают при решении задач распознавания реальные распознающие системы например, другие люди, то такой подход называется внешним. При таком подходе исследователь пытается определить опытным путем, как распознающая система приходит к тому или иному выводу на основе результатов ее восприятия тестового объекта. Комбинируя только что рассмотренные подходы, можно получить четыре основные ветви развития теории распознавания образов. Спиритуалистический подход. Реалистический подход. Материалистический подход. Идеалистический подход. Эти четыре направления, представленные на рис. В данной работе используется комбинация материалистического реалистического и идеалистического подходов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.320, запросов: 244