Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Малашин, Роман Олегович
05.13.01
Кандидатская
2014
Санкт-Петербург
155 с. : ил.
Стоимость:
499 руб.
ОГЛАВЛЕНИЕ
ИСПОЛЬЗОВАННЫЕ СОКРАЩЕНИЯ
ВВЕДЕНИЕ
1 АНАЛИЗ СУЩЕСТВУЮЩИХ МЕТОДОВ СТРУКТУРНОГО АНАЛИЗА
ИЗОБРАЖЕНИЙ
1.1 Структурные методы, абстрагирующиеся от индивидуальных особенностей зрительных образов
1.1.1 Методы, основанные на контурном описании изображения
1.1.2 Методы, основанные на локальных признаках
1.1.3 Способы учета геометрического положения структурных элементов в
пространстве изображения
1.2 Построение структурного описания путем обучения
1.3 Выводы
2 СОПОСТАВЛЕНИЕ ИЗОБРАЖЕНИЙ ТРЕХМЕРНЫХ СЦЕН С
ИСПОЛЬЗОВАНИЕМ КЛАСТЕРНОГО АНАЛИЗА
2.1 Кластеризация параметров сопоставлений ключевых точек
2.1.1 Обнаружение объектов
2.1.2 Сопоставление произвольных трёхмерных сцен
2.1.3 Вероятность образования кластера ключевых точек
2.2 Верификация кластерной гипотезы
2.2.1 Метод наименьших квадратов
2.2.2 Алгоритм ЛАИБАС
2.3 Предварительная обработка сопоставлений
3 ПОИСК ИЗОБРАЖЕНИЙ ТРЕХМЕРНЫХ СЦЕН В БАЗЕ ДАННЫХ С ИСПОЛЬЗОВАНИЕМ КОНЦЕПЦИИ ВИЗУАЛЬНЫХ СЛОВ И КЛАСТЕРНОГО АНАЛИЗА
ЗЛ Применение визуальных слов с использованием структурной информации
3.2 Составление словаря визуальных слов
3.3 Организация процедуры кластеризации с помощью преобразования Хафа.
3.4 Выводы
4 ПРАКТИЧЕСКИЕ РЕЗУЛЬТАТЫ
4.1 Общие особенности практической реализации
4.2 Сопоставление изображений трехмерных сцен
4.3 Поиск изображений трехмерных сцен в базе данных с использованием гистограмм визуальных слов
4.4 Использование структурных методов для улучшения плотных карт глубины
4.4.1 Автоматическая оценка диапазона диспаратностей
4.4.2 Изменение матрицы корреляционной энергии
4.4.3 Результаты
4.4.4 Выводы
4.5 Сопоставление аэрокосмических снимков
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ИСПОЛЬЗОВАННЫЕ СОКРАЩЕНИЯ
АП - аффинное преобразование;
БД - база данных;
ГВС - гистограмма визуальных слов;
КТ - ключевая точка;
МНК - метод наименьших квадратов;
ПГП - преобразование группы подобия;
СА - структурный анализ;
СЛАУ - система линейных алгебраических уравнений; СЭ - структурный элемент.
для БУМ-классификатора) зависит от размера гистограммы, которая в свою очередь зависит от размера словаря.
В классической концепции визуальных слов анализ изображения осуществляется без учета взаимного пространственного положения регионов изображения, соответствующих определенным визуальным словам (хотя существуют модификации, учитывающие эту информацию [7, 126-129]). Это делает возможным успешное распознавание изображений трехмерных сцен или объектов с сильноизменчивой формой, хотя и понижает дискриминационные возможности алгоритма.
Для объектов жёсткой формы популярны классификаторы, использующие НСЮ признаки [130]. В данном случае анализ изображения с использованием пирамиды масштабов ведется в сканирующем окне, сеткой ортогональных линий окно поделено на ячейки, из которых составлены частично налагающиеся блоки, в. которых строятся гистограммы направления градиентов яркости. В отличие от 81РТ-дескриптора в данном случае содержимое блоков не нормализуется относительно вращения, что делает использование НСЮ-дескрипторов ограниченно устойчивым к поворотам объектов в плоскости изображения. Однако сохраненная информация об абсолютном направлении градиентов увеличивает возможности дескриптора при классификации изображений, подвергающихся сложным изменениям. Конкатенацией гистограмм направлений градиентов, вычисленных внутри составляющих окно блоков, формируется многокомпонентный вектор признаков, описывающий содержание сканирующего изображение окна. Классификация текущего содержимого окна выполняется машиной опорных векторов, обучаемой на большом количестве «положительных» и «отрицательных» примеров изображений объектов заданных* классов, что, как демонстрируются в базовой работе Дэйлала и Триггса [130], обеспечивает впечатляющие результаты применения НСЮ-дескрипторов для обнаружения пешеходов в разнообразных ракурсах и позах. Классификацию изображений, применяемую Дэйлалом и Триггсом, также можно лишь условно назвать структурной (изображение внутри окна неизменным путем делится на
Название работы | Автор | Дата защиты |
---|---|---|
Обработка баз данных с персонифицированной информацией для задач обезличивания и поиска закономерностей | Кучин, Иван Юрьевич | 2012 |
Методы и средства прогнозирования и ранней диагностики сердечно-сосудистой патологии на основе рефлексодиагностики и нечеткой логики принятия решений | Татаренков, Алексей Александрович | 2007 |
Темпорально-логический метод и алгоритмы интеллектуальной поддержки принятия решений по проектному управлению промышленным предприятием | Васицына, Анастасия Игоревна | 2013 |