Выбор оптимальной сложности класса логических решающих функций в задачах анализа разнотипных данных

Выбор оптимальной сложности класса логических решающих функций в задачах анализа разнотипных данных

Автор: Бериков, Владимир Борисович

Шифр специальности: 05.13.17

Научная степень: Докторская

Год защиты: 2006

Место защиты: Новосибирск

Количество страниц: 271 с. ил.

Артикул: 3386504

Автор: Бериков, Владимир Борисович

Стоимость: 250 руб.

Выбор оптимальной сложности класса логических решающих функций в задачах анализа разнотипных данных  Выбор оптимальной сложности класса логических решающих функций в задачах анализа разнотипных данных 

Оглавление
Введение
1. Построение решающих функций в задачах предсказания
1.1. Основные понятия
1.2. Обзор методов построения решающих функций распознавания
1.3. Качество решающих функций распознавания .
1.4. Логические решающие функции
1.5. Деревья решений .
Выводы
2. Байесовская модель распознавания конечного множества событий
2.1. Распознавание образов по конечному множеству событий .
2.2. Задание модели .
2.2.1. Основные предположения.
1 2.2.2. Задание априорного распределения с учетом ожидаемой
вероятности ошибки байесовского решающего правила . .
2.3. Исследование байесовской модели распознавания конечного множества событий
2.3.1. Ожидаемый риск неправильного распознавания
2.3.2. Дисперсия функции риска для метода обучения .
2.4. Байесовская модель для метода минимизации эмпирической ошибки.
2.4.1. Ожидаемая вероятность ошибки.
2.4.2. Ожидаемое уклонение
2.4.3. Дисперсия случайной величины вероятности ошибки . . . 6 Ф 2.4.4. Дисперсия уклонения
2.5. Выбор оптимальной решающей функции.
2.5.1. Байесовские оценки риска неправильного распознавания
для решающей функции
2.5.2. Смещение и дисперсия байесовских оценок
2.6. Байесовская оценка как критерий качества дерева решений . . 0 Выводы
3. Алгоритмы построения деревьев решений в задачах анализа разнотипных данных
3.1. Рекурсивный алгоритм построения дерева решений метод .
3.2. Группировка с использованием деревьев решений
3.3. Деревья решений и анализ многомерных разнотипных временных рядов.
3.4. Прогнозирование экстремальных событий .
Выводы
4. Реализация и практическое использование разработанных методов
4.1. Комплекс программ ЛАСТАНМ .
4 4.2. Анализ спектров мутаций в ДНК
4.3. Анализ данных об археологических находках .
4.3.1. Анализ данных о раскопках Маяцкого кургана.
4.3.2. Выявление зависимостей между антропологическими характеристиками древнего населения .
4.3.3. Изучение типологических изменений в процессе развития панцирных доспехов средневековых номадов Центральной Азии .
4.4. Прогноз экстремальных гидрологических ситуаций.
4.5. Анализ гелиогеофизических факторов среды при пренатальном развитии в вероятностной модели прогноза
здоровья человека.
Заключение
Список используемых источников


А.Воронина [] вводится понятие меры сходства между реализациями с учетом типа переменной и описывается применение этого понятия в задачах распознавания. В методе предельных упрощений, предложенном В. И. Васильевым [], заранее предполагается, что разделяющая функция имеет самый простой линейный вид, а процесс обучения состоит в конструировании такого про-странства минимальной размерности, в котором разделяющая функция безошибочно классифицирует обучающую выборку. Предлагается т. Метод опорных векторов [7, 7] использует неявное преобразование наблюдений в пространство высокой размерности с помощью заданной функции ядра. В этом пространстве ищется гиперплоскость, оптимальная с точки зрения максимизации расстояния между ближайшими к ней опорными точками разных образов. Данный метод эффективен в вычислительном плане и может быть использован для обработки больших массивов данных. Методы распознавания, основанные на функциях ядра в сочетании с методом опорных векторов, описаны в работе [3]. Метод структурной минимизации риска [] использует идею перебора последовательно усложняющихся семейств решающих функций, где под сложностью понимается емкостная характеристика класса (или «размерность Вапника-Червоненкиса»). Для поиска оптимальной решающей функции в рамках этого метода авторами предлагается метод «обобщенного портрета», который является предтечей метода опорных векторов. Алгебраический подход в распознавании образов основан на использовании аппарата и методов дискретной математики, алгебры и математической логики. Началу развития данного направления положили работы М. М. Бонгарда [] и М. Н. Вайнцвайга [], в которых был предложен алгоритм КОРА и аналогичные ему для поиска информативных сочетаний значений признаков, а также работы Ю. АВО-алгоритмы). Данные алгоритмы теоретически позволяют реализовать любые другие алгоритмы распознавания, решать задачи, характеризующиеся сложными зависимостями между признаками. Тупиковые тесты применяются для определения информационных весов признаков. Необходимо найти все тупиковые тесты таблицы, что возможно только для небольших таблиц данных. Для преодоления этих трудностей были разработаны алгоритмы вычисления оценок, основанные на определении близости распознаваемого объекта к определенному образу % на заданных опорных множествах. Решение о принадлежности объекта к одному из образов принимается на основе суммирования оценок близости по всем опорным множествам. Наиболее эффективно методы вычисления оценок применяются для обработки дискретных и бинарных характеристик. При логико-вероятностном подходе распознавание осуществляется путем нахождения логических закономерностей, характерных для образов, в наблюдаемых данных (например, с помощью алгоритма ТЕМП []). Методы построения логических решающих функций, которые были предложены ¦ Г. С. Лбовым, Р. Михальским (Я. Требуемое число элементов разбиения (сложность логической решающей функции) задается как эвристический параметр. К этой же группе методов могут быть отнесены методы построения деревьев решений [9, 1, 0, 2, 6, 4, 3, , , , , , , ], представляющих собой удобную форму задания логической решающей функции. Определение оптимальной формы дерева решений (выработка критерия качества и нахождение дерева, дающего оптимальное значение этому критерию) остается пока до конца нерешенной задачей. Методы распознавания образов в бинарном пространстве переменных ^ изложены в [, , ]. Метод распознавания, основанный на процедуре формирования понятий с помощью растущей пирамидальной сети (одной из форм семантической сети) описан в работе []. Методы нейронных сетей используют теорию искусственного интеллекта и основаны на моделировании функционирования биологических нервных систем. Первой работой в этом направлении было создание персептро-на, описанное в работе Ф. Розенблатта []. Обучение искусственной нейронной сети состоит в автоматическом подборе весов и порогов сети, которые бы минимизировали ошибку прогнозирования. Различные методы в рамках данного подхода различаются выбором архитектуры сети, видом передаточной функции, алгоритмом поиска оптимальных весов и т.

Рекомендуемые диссертации данного раздела

04.07.2017

Лето - пора делать собственную диссертацию!

Здравствуйте! Дорогие коллеги, предлагаем Вам объединить отдых и научные исследования. К примеру Вы можете приобрести на нашем сайте 15 ...

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...


Все новости

Время генерации: 0.184, запросов: 242