Методика извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей

Методика извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей

Автор: Вохминцев, Александр Владиславович

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2002

Место защиты: Челябинск

Количество страниц: 217 с. ил

Артикул: 2326462

Автор: Вохминцев, Александр Владиславович

Стоимость: 250 руб.

Методика извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей  Методика извлечения структурных знаний из естественных текстов на основе нечетких семантических гиперсетей 

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1. НАПРАВЛЕНИЯ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ИНФОРМАЦИИ С ПОМОЩЬЮ ТЕХНОЛОГИИ II
1.1 Анализ уровней знаний.
1.2 Технология ii
1.3 Методы ii
1.4 Постановка задачи диссертационной работы
Выводы по главе.
ГЛАВА 2. МОДЕЛЬ ЗНАНИЙ НА ОСНОВЕ НЕЧЕТКОЙ СЕМАНТИЧЕСКОЙ ГИПЕРСЕТИ
2.1 Выбор модели знаний для анализа естественных текстов
2.2 Математическая формализация цбдели знаний на основе
р г
нечеткой семантической гниерсети .
2.2.1 Структура вершины и ребра семантической гиперсети
2.2.2 Математическая формализация семантической
гипсрссти на основе теории нечетких множест в.
2.3 Методы извлечения ассоциаций из нечеткой семантической гипсрссти
2.4 Методы оценки ассоциаций
Выводы по главе.
ГЛАВА 3. МЕТОДИКА ПОСТРОЕНИЯ БАЗЫ ЗНАНИЙ НА ОСНОВЕ НЕЧЕТКОЙ СЕМАНТИЧЕСКОЙ ГИПЕРСЕТИ ПРИ АНАЛИЗЕ ЕСТЕСТВЕННЫХ ТЕКСТОВ НА РУССКОМ ЯЗЫКЕ
3.1 Лингвистический анализ естественного текста.
3.1.1 Модель метатекста русскою языка.
3.1.2 Формализация модели метатекста русского языка на
основе теории нечетких множеств.
3.1.3 Структура лингвистического процессора.
3.2 Иерархия классов объектов.
3.3 Математическая модель дерева решений по модифицированному алгоритму С4.5
3.4 Процедуры построения базы знаний на основе нечеткой
семантической гиперсети
Выводы по главе
ГЛАВА 4. ПРИМЕНЕНИЕ НЕЧЕТКИХ СЕМАНТИЧЕСКИХ ГИПЕРСЕТЕЙ ПРИ АНАЛИЗЕ ЕСТЕСТВЕННЫХ ТЕКСТОВ НА РУССКОМ
4.1 Технология работы с ИАС класса ii па базе
нечеткой семантической гиперсети.
4.2 Архитектура информационноаналитической системы.
4.2.1 Технологии обеспечения безопасности, надежности
и эффективности в ИАС
4.2.2 Технологии аналитической обработки информации в
4.3 Пример анализа естественных текстов с использованием
ИАС на основе нечетких семантических гиперсетей
Выводы по главе
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА


В настоящее время на рынке СОД (систем обработки данных) существует достаточно большое количество программного обеспечения, удовлетворяющего перечисленным требованиям. СОД. Так, например, СУБД Oracle, Sybase, SAS Institute являются лидерами в области реляционных баз данных и хранилищах данных, поэтому компании и институты, занимающиеся разработкой интеллектуальных инфор-маиионно-аналнтическнх систем (IBM, Cognos, SAS Institute, Integral Solutions, DataMind, MathSoft, Unica Technologies, PAR Govemient Systems), обеспечивают поддержку этих СУБД, а сами разрабатывают алгоритмы эффективного извлечения закономерностей из информации. Иерархия уровней знаний извлекаемых из информации приведена на рис. Поверхностный уровень связан с опе/ютивной тратакщичшои обработкой (OLTP) [, , , , 3, IJ, построенной на концепции хранилищ данных. Согласно »той концепции хранилище данных функционирует следующим образом: по определенной процедуре информация из разных источников собирается в хранилище, которое поддерживает хронологию и собирает информацию об объекте исследования в одном месте. Информация приводится к единому формату, а затем агрегируется к некоторому уровню обобщения. Для организации предметного поиска по хранилищу данных могут применяться витрины данных (Data Mart), концепция которых была предложена Forrester Research в г. OLTP технология не определяет архитектуру аналитических систем, а только создает поле деятельности для их функционирования, задавая требования к информации. OLAP (On-Line Analytical Processing) оперативная аналитическая обработка. Рис. Комплексный подход к решению задач анализа информации предлагает OLAP технология [, 7). В основе OLAP технологии лежит многомерное представление информации. Термин OLAP впервые ввел '3. Кодд. Кодду является наиболее подходящим средством для исследования объекта анализа, так как информация агрегируется относительно нескольких измерений, что соответствует ежедневной работе аналитика. Классическая реляционная модель не позволяет анализировать информацию с точки зрения множественности измерений. С другой стороны, множественность измерений не означает, что информация обязательно должна храниться в многомерном виде. В связи с этим различают ROLAP (реляционный OLAP) и МОЬАР(многомерный ОЬЛР), также в последние годы на рынке начинают появляться гибридные -АР продукты, объединяющие гибкость запросов и производительность MOLAP с доступом к реляционным базам данным ROI. АР. OLAP предоставляет пользователю мощный аналитический инструмент для принятия решений, но эта технология не позволяет извлекать закономерности из информации, выявлять скрытые тенденции, что необходимо для повседневной работы информационно-аналитических служб. Разработки и исследования и данном направлении привели к созданию технологии Data Mining. Раш Minins [8, , , 7, 9, 7). Технология Data Mining стала стремительно развиваться в начале -х годов, до этого основным инструментом интеллектуального анализа информации являлась прикладная статистика. Наряду с широким использованием аппарата прикладной статистики (, . J, аналитики практики всегда знали, что применение аппарата математической статистики для решения реальных прикладных задач во многих случаях приводило к неверным выводам. Главная причина, по которой пришлось отказаться от методов анализа информации на основе математической статистики, заключается в концепции усреднения по выборке, приводящей к операциям над фиктивными величинами [. России, прототип среднестатистического россиянина и. Такая ситуация в обработке и анализе информации могла устраивать аналитиков до тех пор, пока они оперировали сравнительно небольшими объемами информации. После появления аппаратных н программных средств, которые позволили эффективно собирать и хранить информацию, в течение десятилетия накопились огромные объемы информации, которую не представляется возможным обработать без привлечения специальных методов извлечения значимых закономерностей из “сырой” информационной руды. Стоимость разработки и эксплуатации системы должна быть существенно меньше, чем стоимость выполняемых работ до использования системы.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.318, запросов: 244