Программные системы для идентификации и локализации объектов в изображениях

Программные системы для идентификации и локализации объектов в изображениях

Автор: Лобив, Игорь Васильевич

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Новосибирск

Количество страниц: 118 с. ил.

Артикул: 2622882

Автор: Лобив, Игорь Васильевич

Стоимость: 250 руб.

Программные системы для идентификации и локализации объектов в изображениях  Программные системы для идентификации и локализации объектов в изображениях 

ВВЕДЕНИЕ.
1. БЫСТРЫЙ ПОИСК ЛОКАЛИЗАЦИЯ ФРАГМЕНТА ФОТОГРАФИЧЕСКОГО ИЗОБРАЖЕНИЯ В ДРУГОМ ИЗОБРАЖЕНИИ
1.1. Обзор существующих методов и систем
1.2. Описание метода, лежащего в основе программной системы локализации образца в изображении.
1.2.1. Определения и обозначения.
1.2.2. Низкочастотная фильтрация.
1.2.3. Медианная фильтрация
1.2.4. Выделение контуров
1.2.5. Дополнительные условия преобразований.
1.2.6. Выбор опорных точек.
1.2.7. Построение структуры вспомогательных данных.
1.2.8. Поиск опорных точек.
1.2.9. Поворот изображения.
1.2 Коррекция по яркости и контрастности.
1.2 Выбор адаптивных порогов.
1.3. Сравнение с аналогичными системами.
1.4. Описание реализации программы
1.4.1. Общая схема реализации и интерфейс
1.4.2. Выделение конту ров.
1.4.3. Формирование вспомогательных данных.
1.4.4. Поиск опорных точек.
1.4.5. Основной цикл распознавания.
1.4.6. Локализация опорных точек с помощью лсрсвообразной поисковой структуры
1.5. Результаты тестовых испытаний
1.6. Параллельный вариант метода
1.7. Выводы.
2. РАСПОЗНАВАНИЕ И ЛОКАЛИЗАЦИЯ ДВИЖУЩЕГОСЯ ОБЪЕКТА В ВИДЕОПОТОКЕ.
2.1. Постановка задачи
2.2. Описание метода
2.2.1. Блок схема алгоритма
2.2.2. Определение адаптивного фильтра.
2.2.3. Этап локализации объектов.
2.2.4. Обработка контуров
2.2.5. Привязка контура к структу ре цепочек.
2.3. Описание прораммной реализации
2.4. Параллельный вариант метода
2.4. Выводы.
3. ЛОКАЛИЗАЦИЯ НА ФОТОГРАФИЧЕСКОМ ИЗОБРАЖЕНИИ МАРКЕРА И РАСПОЗНАВАНИЯ СОДЕРЖАЩЕГОСЯ В НМ ТЕКСТА
3.1. Постановка задачи
3.2. Начальные предположения
3.3. МРМ Модуль Распознавания Маркера.
3.3.1. Нахождение отрезков на изображении
3.3.2. Нахождение отрезков маркера.
3.4. МИМ Модуль Интерпретации Маркера.
3.4.1. Нахождение символов в строке
3.4.2. Идентификация символов.
3.5. Описание программного продукта.
3.6. Параллельный вариант метода
4. ВОССТАНОВЛЕНИЕ ПОЛОЖЕНИЯ ДВИЖУЩЕГОСЯ ТЕЛА ПО ИНФОРМАЦИИ, ПОЛУЧАЕМОЙ С МНОЖЕСТВА ОДНОМЕРНЫХ ВИДЕОКАМЕР
4.1. Постановка задачи
4.2. Факторы, осложняющие решение задачи.
4.3. Математическая постановка задачи
4.4. Аналогичные работы
4.5. Описание метода.
4.5.1. Случай, когда на одном временном шаге данных плоскостей достаточно для однозначного восстановления положения тела.
4.5.2. Случай, когда па одном временном шаге нам приходит недостаточное количество плоскостей менее 6, для того чтобы однозначно восстановить положение тела.
4.5.3. Фильтрация шумов
4.6. Описание программноаппаратного комплекса.
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Созданная система работает в режиме реального времени и по времени локализации не уступает своим зарубежным аналогам. В рамках решения задачи о локализации маркера и распознавания содержащегося в нем текста, реализована система, которая успешно локализует маркеры специального вида, повернутые на произвольный угол, и имеющие произвольный размер. По времени локализации маркеров, искаженных преобразованием поворота, превосходит широко известную систему распознавания текста FineReader. В задаче о восстановлении положения тела по информации, получаемой с множества одномерных видеокамер, предложен новый подход, основанный на использовании многомерного метода Ньютона. При этом фрагмент может быть повернут и/или его масштаб изменен. Поиск фрагментов в изображениях — важная задача, которая в том или ином виде возникает во многих отраслях. В качестве примера можно привести подсчет количества бактерий на фотоснимке, поиск заданного участка местности на аэрофотоснимке и т. Нередко задача осложняется тем, что искомый фрагмент может отличаться от образца расположением, цветовыми характеристиками, такими как яркость, контрастность, насыщенность цвета и др. Его геометрия может быть искажена, например, вытянута по какому-то направлению. Наконец, при разработке систем машинного зрения в робототехнике, систем безопасности, военных систем наведения и целеуказания возникает еще одно требование, состоящее в том, что поиск должен осуществляться максимально быстро. Речь идет об обработке цветных изображений. Более того, для цветного изображения поиск происходит быстрее. Это является отличием от типичных алгоритмов, описанных в литературе, которые работают с цветными изображениями так же медленно, как и с черно-белыми. Особенностью данного алгоритма является также и то, что яркость и контрастность всего изображения и фрагмента могут быть различными. На данный момент в мире существует всего несколько программных продуктов, осуществляющих быстрый поиск образца на изображении для случая, когда образец внутри данного изображения может быть повернут. Еще меньше программ, позволяющих выполнить поиск образца, искаженного аффинным преобразованием. Один из таких продуктов — MaxVision Toolkit фирмы Datacube. При поиске осуществляется коррекция ^ перспективного искажения. Для работы пакета требуются специализированные аппаратные средства. Болсс подробную информацию о фирме и се продуктах можно получить на веб-сайте фирмы []. Существуют и другие программные и программно-аппаратные комплексы, осуществляющие поиск объектов теми или иными методами [-4» ]. В реализованной нами программе образцы для поиска и изображение, в котором осуществляется поиск, могут быть загружены из файлов в одном из распространенных растровых форматов. Искомый фрагмент может быть повернут, растянут или иметь яркость, контраст и насыщенность цвета, отличные от аналогичных параметров образца. Реализованная программа состоит из двух частей — вычислительного ядра и управляющей оболочки, осуществляющей пользовательский интерфейс. Вычислительное ядро можно использовать при разработке других программ с минимальными изменениями, связанными с особенностями конкретной аппаратной платформы,. Программа разработана для операционной системы Microsoft Windows. Пользовательский интерфейс обеспечивает удобное управление функциями программы, вывод результатов в понятной форме, возможность скрыть ту информацию, которая временно не требуется пользователю. Поддерживается большинство широко используемых форматов файлов изображений. При обработке изображений в диссертации используется система цветовых координат RGB. Значения элементов матриц SR(/, j), SG(itj) и SB(i9j) изменяются в пределах от 0 до 5. SR(i'j') = r', Sc(i'J')=g', S„(i'J')=b'. Л p') = max{ I ? C (/;) - Sc (p') |,| (/;) - Ss (p') |}. Введем константу Cy, такую, что если выполнено условие cd(p,p')? Cy9 то считаем что точки рур' имеют одинаковый цвет. При выполнении обратного неравенства - разный. Source Bitmap), 5е =(SRySGyScn) - образец для локализации (Control Bitmap). Л/j :Sf —> S2 - изменения масштаба вдоль направления -1-ширине 5,с, M2:S —».

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.228, запросов: 244