Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних

Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних

Автор: Нейский, Иван Михайлович

Автор: Нейский, Иван Михайлович

Шифр специальности: 05.13.17

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Москва

Количество страниц: 185 с. ил.

Артикул: 4862447

Стоимость: 250 руб.

Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних  Методика адаптивной кластеризации фактографических данных на основе интеграции методов минимального остовного дерева и нечетких К-средних 

Содержание
ВВЕДЕНИЕ.
ГЛАВА 1. АНАЛИЗ МЕТОДОВ И СИСТЕхМ КЛАСТЕРИЗАЦИИ ФАКТОГРАФИЧЕСКИХ ДАННЫХ .
1.1 Основные определения.
1.2. Методы кластеризации
1.2.1. Классификация методов кластерного анализа
1.2.3. Сравнение методов кластеризации
1.3. Сравнение аналитических программных комплексов.
1.4. Предметная область исследования
1.4.1. Структура рынка ценных бумаг.
1.4.2. Виды ценных бумаг.г
1.4.3. Участники рынка ценных бумаг.
1.4.4. Брокерская деятельность профессионального участника рынка ценных бумаг
1.4.5. Основные характеристики предметной области исследования
1.5. Постановка задачи адаптивной кластеризации.
1.6. Выводы.
ГЛАВА 2. ИССЛЕДОВАНИЕ И АДАПТАЦИЯ СУЩЕСТВУЮЩИХ МЕТОДИК КЛАСТЕРИЗАЦИИ ФАКТОГРАФИЧЕСКИХ ДАННЫХ
2.1. Формализованная модель предметной области
2.2. Методика адаптивной кластеризации
2.3. Выбор метода кластеризации.
2.3.1. Выбор метода на основе рекомендаций
2.3.2. Выбор метода на основе критериев.
2.3.3. Выбор метода по общему алгоритму.
2.4. Адаптация методов кластеризации.
2.4.1. Параметрическая настройка методов кластеризации
2.4.2. Адаптация методов кластеризации к предметной области.
2.5. Оценка кластеризации.
2.6. Выводы.
ГЛАВА 3. АДАПТИВНАЯ КЛАСТЕРИЗАЦИЯ
ФАКТОГРАФИЧЕСКИХ ДАННЫХ СМЕШАННОГО ТИПА1
31. Базовые принципы метода АБАКЕ
3.2. Входные данные метода АН АКТ.
3.3. Описание метода АВАКЬ
3.4. Способы построения минимальных остовных деревьев.
3.5. Адаптация метода к предметной области
3.6. Аналитическая оценка сложности метода
3.7. Докластсризация исходных данных в процессе исследования
3.8. Аналитическая оценка сложности докластеризаиии.
3.9. Достоинства и недостатки адаптивной кластеризации
ЗЛО. Обоснование локального критерия оценки качества разбиения 3 Выводы.
ГЛАВА 4. ПРОГРАММНЫЙ КОМПЛЕКС АДАПТИВНОЙ КЛАСТЕРИЗАЦИИ.
4.1. Общее описание.
4.1.1. Цель, назначение и область применения разработки.
4Л.2. Функциональные возможности программного решения.
4Л.З. Описание сущностей и их атрибутов.
4.2. Основные алгоритмы
4.2Л. Алгоритмы построения минимальных остовных деревьев
4.2.2. Алгоритм вычисления среднего значения атрибута символьного типа
4.3. Форматы выходных данных
4.4. Интерфейс взаимодействиям пользователем.
4.4.1. Граф диалога пользовательского интерфейса.
4.5. Описание эксперимента2
4.5.1. Описание сравнительных исследований.
4.5.2. Анализ результатов сравнительных исследований.
4.5.3. Описание оценочных исследований.
4.6. Выводы
ЗАКЛЮЧЕНИЕ.
СПИСОК ЛИТЕРАТУРЫ


Выбранная предметная область (Предметная область) - это область деятельности кредитной организации, в узком смысле данное понятие применяется к брокерскому обслуживанию клиентов профессионального участника на финансовых и фондовых рынках. Смешанные типы данных (СТД) - это совокупность атрибутов числового и текстового типов данных в анализируемых атрибутах объектов Предметной области. Неиерархические методы. Иерархическая кластеризация состоит в последовательном объединении меньших кластеров в большие кластеры или разделении больших кластеров на меньшие кластеры. Дивизимные методы DIANA (Divisive Analysis). Агломеративная группа методов (рис. На первом шаге наиболее похожие объекты объединяются в кластер. На последующих шагах объединение продолжается до тех пор, пока все объекты не будут составлять один кластер. Методы по способу Ойр»в<Л»М Д1ММ. Агломврвтиыяя* методы (ла«С5)! CHAV. CLt. Агтссити к-сослми («. ГАМ (рргсьэгхпд ш. М ОДЫ ПО КОЛИЧВС! Месит аб. Рис. Классификация методов кластеризации. Дивизимная группа методов (рис. В начале работы алгоритма все объекты принадлежат одному кластеру, который на последующих шагах делится на меньшие кластеры, в результате образуется последовательность расщепляющих групп. Самую значимую часть неиерархических методов представляют собой итеративные методы (рис. Данная группа методов основана на разделении набора данных на некоторое количество отдельных кластеров. Существуют два подхода для разделения данных [, 9]. Первый подход заключается в определении границ кластеров как наиболее плотных участков в многомерном пространстве характеристик объектов:, т. Второй подход заключается в минимизации меры различия объектов. Методы кластерного анализа данных можно разделить по способу анализа данных (рис. При выполнении разбиений с помощью четких методов объекты по кластерам распределяются в виде точного отношения объекта к кластеру, в случае нечеткого разбиения объекту сопоставляется степень принадлежности к разным кластерам в соответствии с его характеристиками. Методы кластерного анализа данных можно разделить по количеству применений алгоритмов кластеризации (рис. Одноэтапные методы кластеризации характеризуются тем, что процесс разбиения исходных данных происходит один раз. Методы с многоэтапной кластеризацией выполняют процесс кластеризации два и более раз, тем самым повышая качество разбиения. Методы кластерного анализа данных можно разделить по возможности расширения объема обрабатываемых данных (рис. Масштабируемые методы кластерного анализа позволяют расширять количество объектов и характеристик объектов, обеспечивая нелинейную зависимость времени выполнения процесса, количества действий в процессе разбиения от расширяемых характеристик [6, 8, . Методы кластерного анализа данных можно разделить по времени выполнения кластеризации (рис. Потоковые методы, в отличие от не потоковых, позволяют проводить добавление объектов исследования, совмещая результаты с полученными ранее результатами. В не потоковых методах при добавлении новых объектов исследования необходимо перевыполнять анализ сначала. В таблице 1 приведено сравнение девяти методов: CURE, BIRCH; MST, lt-средних, РАМ, CLOPE, Самоорганизующиеся карты Кохонена, НСМ, Fuzzy С-means, для которых выделены их достоинства и недостатки. Табл. Метод. Достоинства Недостатки! MST выделяет кластеры произвольной формы, в т. CLOPE высокие масштабируемость и скорость работы, а гак же качество кластеризации, что достигается использованием глобального критерия оптимизации на основе максимизации градиента высоты гистограммы кластера. Он легко рассчитывается и интерпретируется. Во время работы алгоритм хранит в ИАМ небольшое количество информации по каждому кластеру и требует минимальное число сканирований набора данных. Метод Достоинства- Недостатки. Приложение 1) отсутствуют методы, которые имеют достаточное количество обоснованных рекомендаций, успешное применение в данной области и по своим характеристикам полностью ей соответствуют, но стоит отметить, что среди этих методов есть метод MST, который способен выделять кластеры произвольной формы, и метод Fuzzy C-means, который способен выполнять нечеткое разбиение, которое повышает качество получаемого результата.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.277, запросов: 244