Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности

Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности

Автор: Данилкин, Сергей Владимирович

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Тамбов

Количество страниц: 204 с. ил.

Артикул: 4724569

Автор: Данилкин, Сергей Владимирович

Стоимость: 250 руб.

Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности  Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности 

СОДЕРЖАНИЕ
ОСНОВНЫЕ И УСЛОВНЫЕ СОКРАЩЕНИЯ И ОБОЗНАЧЕНИЯ.
ВВЕДЕНИЕ.
1 РЕШЕНИЕ ЗАДАЧ КЛАССИФИКАЦИИ И ПРОБЛЕМА
НЕОПРЕДЕЛЕННОСТИ. IО
1. Общая постановка задачи классификации и основные направления ее
решения
1.2 Основные концепции неопределенности в задачах классификации
1.2.1 Основы подхода к решению задач классификации с позиции
теории нечетких множеств.
1.3 Постановка цели и задач исследования.
2 АНАЛИТИЧЕСКИЕ И ПРОЦЕДУРНЫЕ МОДЕЛИ ДЕКОМПОЗИЦИИ ЦЕЛЕВОГО ПРОСТРАНСТВА ИНФОРМАЦИОННЫХ МАССИВОВ И ПОСТРОЕНИЕ ОЦЕНКИ СЛОЖНОСТИ ИНФОРМАЦИОННЫХ МАССИВОВ.
2.1 Структура отношений на целевом пространстве информационных массивов
2.2 Отображения целевого пространства информационных массивов
2.3 Декомпозиция целевого пространства информационных массивов
2.4 Функция оценки близости и метрики па декомпозиции целевого пространства информационных массивов
2.5 Определение сложности
2.6 Оценка сложности информационных массивов.
2.7 Декомпозиция целевого пространства информационных массивов по сложности.
2.8 Формулировка принципа сложности для информационного массива
2.9 Оператор и функционал сложности информационного массива
2. Критерий сложности построения информационного массива.
2. Критерий обобщенной эффективности.
2. Связь с теорией нечетких множеств
Выводы по главе
3 ФОРМИРОВАНИЕ ИНФОРМАЦИОННЫХ МАССИВОВ ДЛЯ
РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ.
3.1 Методы оценки релевантности.
3.2 Формирование пространства информационных массивов
3.3 Постановка задач выбора метода решения задачи классификации
3.4 Результаты решения задачи классификации
Выводы по главе.
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ


Достаточно полный обзор метрик и мер близости, формализующих понятие сходства и используемых в задачах классификации, содержится в работах [-]. Рассмотрим формы представления исходных данных в задачах классификации в условиях отсутствия обучающих выборок. Гп(х). Хх,. У • ••• Y • •••• • У 2п 9 (1. Уу представляет отдаленность объектов х( и х^ друг от друга. Р • • •• Р • •••• •** Р 2м • •• •••• 9 (1. Следует сразу оговорить, что при такой постановке задачи исходные данные могут иметь и вероятностную природу, однако поскольку объектом рассмотрения является кластерный анализ, то следует придерживаться взгляда о геометрической природе исходных данных. Необходимо также отметить, что аналогичным образом интерпретируется исходная информация в задаче классификации совокупности признаков, характеризующих множество объектов, представленных в виде матрицы «объект-свойство». Хтхп. Поскольку постановка задачи и основная методологическая схема исследования и для задачи классификации объектов, и для задачи классификации признаков являются общими [], то дальнейшее рассмотрение проблемы классификации будет проводиться применительно к объектам, а в случае задачи классификации признаков этот момент будет оговариваться особо. Аг/},/ = 1,/? ГХ) на однородные классы таким образом, чтобы точки, принадлежащие одному классу, находились бы относительно близко друг от друга, а сами классы различались бы между собой. Следует указать, что термин «кластер» (cluster), имеющий английское происхождение, понимается в математике как группа элементов, характеризуемых некоторым общим свойством, а термин «таксон» (taxon), используемый в биологии и также заимствованный из английского языка, в задаче кластерного анализа понимается как систематизированная группа любой категории. При такой постановке задачи оказывается необходимым формальное определение понятий однородности и близости объектов. Апредставляют собой, как указывалось выше, векторы-столбцы геометрических координат наблюдений в т - мерном признаковом пространстве Im (X). Xjxnxj eX,i,j = 1 ,п объекты считаются однородными и попадают в один класс. Xi}Ji= ,п. Бели же способ вычисления рj задан, то возможен переход от матрицы Хтхп к матрице ряхи. Обратный переход от матрицы рпхп к матрице Хт осуществляется с помощью аппарата многомерного метрического шкалирования. Проблема выбора метрики или меры близости детально рассматривается С. А. Айвазяном [] и И. Д. Манделем [8]. Выбор меры близости или расстояния определяется, во-первых, конечной целью проводимого исследования, природой исходных данных, а также некоторыми предположениями, к примеру, о форме кластеров и их взаимном расположении. С. А. Айвазян совершенно справедливо подчеркивал, что «выбор метрики (или меры близости) является узловым моментом исследования» []. Для анализа структуры множества объектов, а также при разработке различных алгоритмов классификации иногда оказывается необходимым рассматривать близость не только отдельных объектов, но и целых классов, для чего также используются различные расстояния и меры близости, что более подробно рассматривается С. А. Айвазяном в работе []. Если в процессе исследования имеются некоторые предположения о свойствах кластеров или принципах объединения объектов в классы, то оказывается вполне естественным формально определить понятие кластера и построить процедуру, выделяющую из исходного множества объектов группы, удовлетворяющие данному определению. Подобный подход является основой эвристического направления решения задачи кластерного анализа, а алгоритмы, разбиения исходного множества объектов на кластеры с заранее заданными свойствами, соответствующие группе методов этого направления, носят общее название эвристических алгоритмов. Если же целью исследования является не разбиение исходного множества объектов на классы, а выявление стратификационной структуры исходного множества, то применяются методы, объединенные в иерархическое направление кластер-анализа. Группа иерархических методов объединяет агломеративные и дивизимные алгоритмы кластер-анализа.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.222, запросов: 228