+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Модели и методы гибридной реляционной кластеризации данных

  • Автор:

    Климова, Анжелика Сергеевна

  • Шифр специальности:

    05.13.18

  • Научная степень:

    Кандидатская

  • Год защиты:

    2013

  • Место защиты:

    Казань

  • Количество страниц:

    107 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ОБЗОР МЕТОДОВ КЛАСТЕРИЗАЦИИ И ВИЗУАЛИЗАЦИИ
ДАННЫХ И ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ
ГЛАВА 2. ИНВАРИАНТНЫЕ ПРОЦЕДУРЫ РЕЛЯЦИОННОЙ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ
2.1. Нечеткие отношения сходства
2.2. Инвариантные кластерные процедуры
2.3. Общая схема инвариантных иерархических кластерных алгоритмов.
2.4. Кластерные процедуры с тождественными функциями 1) - бз
2.5. Кластерные процедуры, основанные на идее «обрыва мостов»
2.6. Гибридная процедура реляционной кластеризации с визуализацией сильных связей между объектами
ГЛАВА 3. ЭВОЛЮЦИОННЫЕ ПРОЦЕДУРЫ ВИЗУАЛИЗАЦИИ МНОГОМЕРНЫХ ДАННЫХ
3.1. Постановка задачи визуализации данных
3.2. Эволюционная процедура двумерной визуализации данных
3.3. Эволюционная процедура трехмерной визуализации данных
3.4. Гибридная кластеризация с двухмерной визуализацией результатов кластеризации данных
3.5. Гибридная кластеризация с трехмерной визуализацией результатов кластеризации данных
ГЛАВА 4. ОПИСАНИЕ КОМПЛЕКСА ПРОГРАММ ГИБРИДНОЙ
КЛАСТЕРИЗАЦИИ
4Л. Описание комплекса программ
4.2. Преобразование скользящих аппроксимаций
4.3. Применение метода гибридной кластеризации с визуализацией сильных связей для исследования связей между инвестициями регионов Приволжского Федерального Округа
4.4. Применение метода гибридной кластеризации к анализу взаимодействия нефтяных скважин
4.5. Применение метода гибридной кластеризации к анализу среднего потребления электроэнергии странами бывшего Советского Союза
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ
Актуальность. Кластеризация данных играет большую роль в анализе данных в экономике, в социальных науках, в технике, биологии, геологии, астрономии и в других научных областях. Кластеризация позволяет представить исследуемые данные в виде разбиения на классы сходных объектов, что является одним из важных этапов формирования знаний об исследуемой предметной области, ее моделирования и анализа [1, 2, 3, 4, 5, 6-8]. Кластерный анализ активно развивается последние десятилетия, однако «идеальных» алгоритмов кластеризации до сих пор не разработано и, по-видимому, разработано быть не может, что можно объяснить следующими причинами. Во-первых, структура реальных данных не всегда может быть адекватно представлена в виде разбиения на классы сходных объектов; во-вторых, данные могут допускать различные разбиения на классы сходных объектов; в-третьих, помимо структуры классов сходства, формируемой кластерным алгоритмом, часто желательно выявить дополнительную информацию о связях между объектами. Поэтому актуальной является задача разработки гибридных методов кластеризации, дающих новые методы представления структуры данных на основе кластерного анализа. В настоящее время активно развиваются методы сочетания нескольких кластерных процедур, методы комбинирования кластеризации с визуализацией данных и др. [9-13]. При этом важным является использование кластерных алгоритмов, удовлетворяющих условиям инвариантности относительно исходной нумерации (перестановки) кластеризуемых объектов и инвариантности относительно монотонных преобразований значений сходства [14-26]. К сожалению, эти условия инвариантности не выполняются для большинства известных кластерных алгоритмов. Поэтому важной является задача разработки гибридных кластерных алгоритмов, удовлетворяющих указанным условиям инвариантности. В работах Батыршина И.З. и др. разработана реляционная схема иерархических инвариантных процедур кластеризации, основанная на преобразовании заданного взвешенного отношения сходства во взвешенное (нечеткое) отношение
Не трудно видеть, что для данных <Х, Бх> и кластерной процедуры <2 на И, изменение нумерации сг/ на сг? может, конечно, случиться так, что покрытия С2(Х)=<У21 (С2(Х)) и С/(X) - а/'1 (С/(И)) множества объектов X будут различны. Кластерный алгоритм Q будет называться инвариантным относительно нумерации объектов, если для всех множеств X, функции близости £ х на X и нумерации О/ и сг2 множества X следует, что аг‘(С1(Ы)) =а^'(СгО^)), где СXX) и С2(Х) покрытия А, построенные алгоритмом <2 на основе 5х, нумераций О/ и сг2 и соответствующих функций близости ^((п(х), (тХу)) и Б>1((72(х), (Т2(у)).
Предположим, что к это строго монотонная функция к:Я—>Я, т. е. для любых а,ЬеЯ из того, что а<Ъ следует, что к(а)<к(Ь). Для любой функции близости Бх на X композиция И °БХ будет определять функцию близости на X, такую что (к с8х)(х, у)=к(Бх(х, у)) для всех х, у еХ. Аналогично, для любой функции близости 5^ на N композиция к ‘5^ будет определять функцию близости на А, так что (к°8м)(г, ])=к(Зь‘(г, ))) для всех г, /еА. Кластерная процедура Q будет называться инвариантной к монотонным преобразованиям значений близости между элементами, если для всех строго монотонных функций к-Х-^Я, множеств А и функций близости 5Л' на А процедура £> строит совпадающие покрытия С(Х)=-Ск(Х), где С (А) и С/,(М) покрытия А, построенные процедурами () на основе и к °5Х соответственно. Свойство инвариантности кластерных процедур относительно монотонных преобразований значений близости необходимо для этой процедуры, если значения близости между объектами измерены экспертами субъективно в порядковой шкале.
2.3. Общая схема инвариантных иерархических кластерных алгоритмов
Неинвариантная оптимальная кластеризация может быть результатом наличия равных значений сходства у функции сходства. На практике равные значения сходства часто появляются как результат округления вещественных чисел или использования шкал сходства с предельным значением или как

Рекомендуемые диссертации данного раздела

Время генерации: 0.144, запросов: 967