Диссертация на тему "Модели и методы гибридной реляционной кластеризации данных", скачать бесплатно автореферат по специальности 05.13.18 - Математическое моделирование, численные методы и комплексы программ

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. ОБЗОР МЕТОДОВ КЛАСТЕРИЗАЦИИ И ВИЗУАЛИЗАЦИИ
ДАННЫХ И ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ
ГЛАВА 2. ИНВАРИАНТНЫЕ ПРОЦЕДУРЫ РЕЛЯЦИОННОЙ ИЕРАРХИЧЕСКОЙ КЛАСТЕРИЗАЦИИ
2.1. Нечеткие отношения сходства
2.2. Инвариантные кластерные процедуры
2.3. Общая схема инвариантных иерархических кластерных алгоритмов.
2.4. Кластерные процедуры с тождественными функциями 1) - бз
2.5. Кластерные процедуры, основанные на идее «обрыва мостов»
2.6. Гибридная процедура реляционной кластеризации с визуализацией сильных связей между объектами
ГЛАВА 3. ЭВОЛЮЦИОННЫЕ ПРОЦЕДУРЫ ВИЗУАЛИЗАЦИИ МНОГОМЕРНЫХ ДАННЫХ
3.1. Постановка задачи визуализации данных
3.2. Эволюционная процедура двумерной визуализации данных
3.3. Эволюционная процедура трехмерной визуализации данных
3.4. Гибридная кластеризация с двухмерной визуализацией результатов кластеризации данных
3.5. Гибридная кластеризация с трехмерной визуализацией результатов кластеризации данных
ГЛАВА 4. ОПИСАНИЕ КОМПЛЕКСА ПРОГРАММ ГИБРИДНОЙ
КЛАСТЕРИЗАЦИИ
4Л. Описание комплекса программ
4.2. Преобразование скользящих аппроксимаций
4.3. Применение метода гибридной кластеризации с визуализацией сильных связей для исследования связей между инвестициями регионов Приволжского Федерального Округа
4.4. Применение метода гибридной кластеризации к анализу взаимодействия нефтяных скважин
4.5. Применение метода гибридной кластеризации к анализу среднего потребления электроэнергии странами бывшего Советского Союза
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ
Актуальность. Кластеризация данных играет большую роль в анализе данных в экономике, в социальных науках, в технике, биологии, геологии, астрономии и в других научных областях. Кластеризация позволяет представить исследуемые данные в виде разбиения на классы сходных объектов, что является одним из важных этапов формирования знаний об исследуемой предметной области, ее моделирования и анализа [1, 2, 3, 4, 5, 6-8]. Кластерный анализ активно развивается последние десятилетия, однако «идеальных» алгоритмов кластеризации до сих пор не разработано и, по-видимому, разработано быть не может, что можно объяснить следующими причинами. Во-первых, структура реальных данных не всегда может быть адекватно представлена в виде разбиения на классы сходных объектов; во-вторых, данные могут допускать различные разбиения на классы сходных объектов; в-третьих, помимо структуры классов сходства, формируемой кластерным алгоритмом, часто желательно выявить дополнительную информацию о связях между объектами. Поэтому актуальной является задача разработки гибридных методов кластеризации, дающих новые методы представления структуры данных на основе кластерного анализа. В настоящее время активно развиваются методы сочетания нескольких кластерных процедур, методы комбинирования кластеризации с визуализацией данных и др. [9-13]. При этом важным является использование кластерных алгоритмов, удовлетворяющих условиям инвариантности относительно исходной нумерации (перестановки) кластеризуемых объектов и инвариантности относительно монотонных преобразований значений сходства [14-26]. К сожалению, эти условия инвариантности не выполняются для большинства известных кластерных алгоритмов. Поэтому важной является задача разработки гибридных кластерных алгоритмов, удовлетворяющих указанным условиям инвариантности. В работах Батыршина И.З. и др. разработана реляционная схема иерархических инвариантных процедур кластеризации, основанная на преобразовании заданного взвешенного отношения сходства во взвешенное (нечеткое) отношение
Не трудно видеть, что для данных <Х, Бх> и кластерной процедуры <2 на И, изменение нумерации сг/ на сг? может, конечно, случиться так, что покрытия С2(Х)=<У21 (С2(Х)) и С/(X) - а/'1 (С/(И)) множества объектов X будут различны. Кластерный алгоритм Q будет называться инвариантным относительно нумерации объектов, если для всех множеств X, функции близости £ х на X и нумерации О/ и сг2 множества X следует, что аг‘(С1(Ы)) =а^'(СгО^)), где СXX) и С2(Х) покрытия А, построенные алгоритмом <2 на основе 5х, нумераций О/ и сг2 и соответствующих функций близости ^((п(х), (тХу)) и Б>1((72(х), (Т2(у)).
Предположим, что к это строго монотонная функция к:Я—>Я, т. е. для любых а,ЬеЯ из того, что а<Ъ следует, что к(а)<к(Ь). Для любой функции близости Бх на X композиция И °БХ будет определять функцию близости на X, такую что (к с8х)(х, у)=к(Бх(х, у)) для всех х, у еХ. Аналогично, для любой функции близости 5^ на N композиция к ‘5^ будет определять функцию близости на А, так что (к°8м)(г, ])=к(Зь‘(г, ))) для всех г, /еА. Кластерная процедура Q будет называться инвариантной к монотонным преобразованиям значений близости между элементами, если для всех строго монотонных функций к-Х-^Я, множеств А и функций близости 5Л' на А процедура £> строит совпадающие покрытия С(Х)=-Ск(Х), где С (А) и С/,(М) покрытия А, построенные процедурами () на основе и к °5Х соответственно. Свойство инвариантности кластерных процедур относительно монотонных преобразований значений близости необходимо для этой процедуры, если значения близости между объектами измерены экспертами субъективно в порядковой шкале.
2.3. Общая схема инвариантных иерархических кластерных алгоритмов
Неинвариантная оптимальная кластеризация может быть результатом наличия равных значений сходства у функции сходства. На практике равные значения сходства часто появляются как результат округления вещественных чисел или использования шкал сходства с предельным значением или как

Название работы	Автор	Дата защиты
Бессеточная технология численного моделирования взаимодействий вязкой жидкости и систем профилей с кинематическими и упругими связями	Дынников Ярослав Алексеевич	2016
Апостериорные оценки точности приближенных решений некоторых задач механики и математической физики	Музалевский, Алексей Витальевич	2017
Модель, метод и комплекс программ по управлению рисками физической безопасности линейной части магистрального нефтепровода	Кукало, Иван Анатольевич	2015

Электронная библиотека диссертаций

Модели и методы гибридной реляционной кластеризации данных

Рекомендуемые диссертации данного раздела