Исследование и разработка методов извлечения знаний для создания интеллектуальных систем поддержки принятия решений

Исследование и разработка методов извлечения знаний для создания интеллектуальных систем поддержки принятия решений

Автор: Айман Мохамед Мофтах Кхамес Йоунес Бериша

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2005

Место защиты: Москва

Количество страниц: 218 с. ил.

Артикул: 2745184

Автор: Айман Мохамед Мофтах Кхамес Йоунес Бериша

Стоимость: 250 руб.

Содержание
ВВЕДЕНИЕ
ГЛАВА 1 Обзор систем обнаружении знаний и системизвлечения знаний
1.1 Системы поддержки принятия решений.
1.2 Нерешенные проблемы баз данных.
1.3 Процесс обнаружения знаний.
1.4 Задачи обнаружения знаний
1.5 методология обнаружения знаний.
1.6 Сравнение аналитических систем различного типа.
1.6.1 Предметноориентированные аналитические системы технический анализ
1.6.2 Статистические пакеты.
1.6.3 НсГфониые сети
1.6.4 системы рассуждения на основе аналогичных случаев.
1.6.5 Деревья решений.
1.6.6 Генетические алгоритмы
1.6.7 Нелинейные регрессионные методы методы группового учта атрибутов
1.7 Описание дерева решений
1.8 Основные алгоритмы, использующие деревья решений.
1.8.1 Алгоритм I3
1.8.2 Определения..
1.8.3 Использование критерия прироста ннформагивносги i i
1.8.4 Алгоритм С4.5.
1.9 Методы сокращения решающих деревьев
1.9.1 Сокращение, уменьшающее ошибки i
1.9.2 Сокращение по пессимистической ошибке iii i
1.9.3 Сокращение по минимальной ошибке ii i
1.9.4 Сокращение по критическому значению ii i
1.9.5 Сокращение, основанное на ошибках i.
1. Выводы по главе 1.
Глава 2 Индуктивное построение понятий при зашумлнных данных
2.1 Признаковое описание объекта.
2.2 Проблемы, возникающие при работе с зашумлнными данными
2.2.1 Ограниченная информация.
2.2.2 Искажнная информация
2.2.3 Большой размер баз данных
2.2.4 Изменение баз данных со временем.
2.3 Проблема моделирования шума в данных
2.3.1 Внесение шума в поле признака, содержащего дискретные значения.
2.3.2 Внесение шума в иоле признака, содержащего непрерывные значения
2.4 Анализ распределения значений для непрерывных признаков.
2.4.1 Оценка математического ожидания, дисперсии, функции распределения и плотности
2.4.2 Распределения, отличные от равномерных.
2.5 Моделирование шума в обучающей выборке
2.6 Выводы по главе 2.
Глава 3 Методы построении деревьев решений при наличии шума во входных данных.
3.1 Постановка задачи индуктивного построения понятий при отсутствии шума и при наличии шума
3.2 Алгоритм предсказания неизвестных значений по методу ближайшего соседа
3.3 Использование алгоритма восстановления неизвестных значений при построении дерева решений
3.4 Описание работы алгоритмов ШЗ и С4.5 в сочетании с алгоритмами восстановления
3.5 Описание метода сокращения решающих деревьев.
3.6 Выводы по главе 3
Глава 4 Программная реализация разработанного метода
4.1 Основные функции, выполняемые программой.
4.2 Структура программного комплекса.
4.3 Описание программы.
4.4 Эксперименты на тестовых данных
4.4.1 Эксперименты на данных задач монахов
4.4.2 Медицинские данные
4.4.3 Данные проекта
4.4.4 Другие наборы данных
4.5 Методы проверки.
4.5.1 Перекрестная проверка.
4.5.2 Проверка исключением одного примера.
4.5.3 Метод бутстрспа.
4.6 Методика проведения эксперимента по работе алгоритма ЮТТУ
4.7 Выводы по главе 4.
ЗАКЛЮЧЕНИЕ.
С н и со к.литературы.
Приложение 1 Исходный текст программного средства.
Приложение 2 Примеры работы программы .
Приложение 3 Акт о внедрении
ВВЕДЕНИЕ
Актуальность


Модель, работающая сегодня, может оказаться неработоспособной в дальнейшем, и также необходимо наблюдать за поведением модели, чтобы убедиться в сё соответствии стандартам. В сердцевине процесса извлечения знаний из баз данных находятся методы, применяемые в Data mining для извлечения индуктивных понятий или образов из данных. Такие методы могут иметь различные цели, зависимо или независимо от результата общего процесса извлечения знаний из баз данных. Следует заметить, что различные методы, ставящие различные цели, могут успешно применяться для достижения желаемого результата. Например, чтобы выявить покупателей, заинтересованных в приобретении нового продукта, аналитик может использовать на первом этапе кластеризацию применительно к выборке данных о покупателях в базе данных, затем, применяя регрессию, можно предсказывать поведение покупателей, отнесенных к каждому из выделенных кластеров. Автоматизация некоторых наиболее типичных способов обработки данных и успешная интеграция их в общий процесс может полностью исключить или хотя бы существенно снизить потребность в разработке специализированных программ и экспорт/импорт данных, что повышает продуктивность работы аналитика. Предсказание: если даны экземпляр данных и предсказывающая модель, попытаемся предсказать значение определенного атрибута из набора данных. Например, имея предсказывающую модель для операций с кредитной картой, выявлять мошеннические транзакции. Предсказание, таким образом, может использоваться для подтверждения найденных гипотез. Регрессия: Если дано множество (выборка) данных, регрессия заключается в анализе зависимостей значений некоторых атрибутов от значений других атрибутов в конкретном экземпляре данных и в автоматическом порождении модели, способной предсказать значения таких атрибутов для новых записей. Например, в случае рассмотрения множества транзакций для кредитной карты, надо построить модель, которая способна предсказать вероятность мошенничества для новой транзакции. Классификация: имея множество определенных четких классов, определить, к которым из этих классов принадлежит конкретный экземпляр данных. Например, при заданных классах пациентов, которые поддаются различным способам лечения, идентифицировать форму лечения, необходимую для нового пациента. Кластеризация: при заданном множестве (выборке) данных разделить это множество на классы так, чтобы сгруппировать экземпляры данных со сходными характеристиками. Кластеризацию удобно использовать для нахождения групп объектов, схожих между собой. Например, пусть дано множество покупателей, надо идентифицировать группы покупателей с одинаковым уровнем потребления. Анализ связей (ассоциации): при заданном множестве данных идентифицировать отношения между атрибутами и объектами так, что принадлежность объекта к одному классу подразумевает наличие другого класса. Поиск отношений между объектами в определённый период времени также часто характеризуют как "последовательный анализ классов". Кроме того, система "глаз-мозг", которой обладает человек, является сама но себе наилучшей известной системой, способной распознавать образы. Используя технику визуализации, можно перейти от простых изображений в виде набора точек и гистограмм в параллельных координатах к трёхмерным представлениям. Разведочный анализ данных: разведочный анализ данных - это интерактивное исследование множества данных без сильных зависимостей от предвзятых предположений и моделей, то есть делается попытка идентифицировать среди объектов множества "интересные" образы (классы). Графическое представление данных: применяется очень часто для использования возможностей человеческого глаза и человеческой интуиции. Поскольку имеется много подходящих пакетов прикладных программ, которые были созданы исключительно для поддержки процесса исследования данных, было бы желательно интегрировать такие подходы в общую среду системы обнаружения знаний в базах данных (КЭО). Очевидно, что обнаружение знаний - это не единственный метод, способный помочь получить больше информации из представленных данных. Различные методы требуют различных целей, каждый предложенный метод имеет свои преимущества.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.252, запросов: 244