Методы и алгоритмы обнаружения семантических ошибок в гипертекстовых информационных ресурсах на основе онтологических моделей

Методы и алгоритмы обнаружения семантических ошибок в гипертекстовых информационных ресурсах на основе онтологических моделей

Автор: Хлопотов, Михаил Викторович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Уфа

Количество страниц: 135 с. ил.

Артикул: 2740919

Автор: Хлопотов, Михаил Викторович

Стоимость: 250 руб.

ВВЕДЕНИЕ
ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ И ОБЗОР МОДЕЛЕЙ ОНТОЛОГИЙ
1.1. Гипертекстовый информационный ресурс ГИР.
1.1.1. Понятие гипертекста.
1.1.2. Понятие информационного ресурса.
1.1.3. Классификация ГИР.
1.2. Ошибки в ГИР
1.2.1. Понятие ошибки.
1.2.2. Классификация ошибок
1.2.3. Обнаружение ошибок
1.3. Представление смысла
1.4. Обзор моделей онтологий.
1.4.1. Семантическая сеть, .
1.5. Формулировка задачи автоматизации обнаружения
семантических ошибок в ГИР.
Выводы.
ГЛАВА 2. ОБЩАЯ МАТЕМАТИЧЕСКАЯ МОДЕЛЬ СЕМАНТИКИ ГИР.
2.1. Представление семантики ГИР на основе стандарта .
2.1.1. Интерпретация семантической сети
2.1.2. Следование семантических сетей
2.1.3. Понятие семантической целостности.
2.2. Онтология как математическое описание семантики
предметной области.
2.2.1. Классы объектов.
2.2.2. Свойства и отношения между объектами
2.2.3. Ограничения на классах
2.3. Расширения модели онтологий.
2.3.1. Контекстные свойства
2.3.2. Семантические правила
2.3.3. Операция расширения семантической сети.
2.4. Возможные парадоксы в семантической сети представления ГИР
2.4.1. Понятие парадокса
2.4.2. Парадоксы ограничений классов
2.4.3. Парадоксы свойств
Выводы.
ГЛАВА 3. АЛГОРИТМЫ ОБНАРУЖЕНИЯ СЕМАНТИЧЕСКИХ
ОШИБОК В ГИР НА ОСНОВЕ ОНТОЛОГИЙ.
3.1. Основные операции
3.1.1. Структуры данных.
3.1.2. Алгоритмическая поддержка объектов и свойств.
3.1.3. Базовые алгоритмы
3.2. Алгоритм расширения семантический сети.
3.2.1. Преобразование сети условий
3.2.2. Алгоритм выполнения расширительных правил
3.2.3. Формирование семантической сети на основе
естественных текстов ГИР.
3.3. Алгоритм проверки семантической целостности сети.
3.3.1. Выполнение проверочных правил
3.3.2. Алгоритм поиска объектовпарадоксов
3.3.3. Формирование отчета об обнаруженных парадоксах.
3.4. Архитектура информационной системы.
3.4.1. Общая технологическая схема
3.4.2. Программные модули системы.
3.4.3. Интерфейс пользователя
ГЛАВА 4. РАЗРАБОТКА ОНТОЛОГИИ И ВНЕДРЕНИЕ
ИНФОРМАЦИОННОЙ СИСТЕМЫ
4.1. Базовая онтология вебсайтов
4.1.1. Иерархия классов
4.2. Ограничения правила.
4.2.1. Правило контекстные свойства.
4.2.2. Правило даты в диапазоне.
4.3. Настройка ИС на примере АЗ Урал
4.4. Взаимодействие с ИС
4.4.1. Ввод документов
4.4.2. Обнаружение, исследование и устранение парадоксов
ЗАКЛЮЧЕНИЕ
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
ПРИЛОЖЕНИЕ.
ВВЕДЕНИЕ


Чем крупнее ресурс, тем больше вероятность того, что очередной документ содержит семантическую ошибку редакторы ресурса просто не знают о необходимости внести исправления в конкретный документ. Текстовые поисковые системы также не способны справиться с обнаружением устаревших или содержащих ошибки фрагментов документов одна и та же информация может представляться в разной форме и с различной степенью детальности. ГИР, т. На сегодняшний день разработано большое количество моделей представления семантики,, и программного обеспечения, осуществляющего извлечение семантики из естественного текста 3, , поэтому построение семантического представления документов семантический анализ не является задачей данного диссертационного исследования. Для обнаружения смысловых ошибок ГИР помимо собственно представления семантики необходима информация о предметной области, свойственных ей понятиях и отношениях между ними, а также ограничениях, свойственным этим отношениям. Такую информацию принято называть Онтологией, и онтологическая информация может быть использована для эффективного обнаружения нарушений правил предметной области. Такие нарушения будем называть парадоксами, и будем рассматривать поиск парадоксов как одну из задач исследования. Основной целью диссертационного исследования является разработка методов и алгоритмов обнаружения семантических ошибок в ГИР на основе семантических моделей выявления парадоксов в информационных ресурсах. ТеегеПЬгшп, осуществляющую обнаружение семантических ошибок в ГИР. Ыместным предикатам, а также новый алгоритм обработки Ыместных предикатов в виде набора 2х местных предикатов. При выполнении исследования используется математический аппарат теории множеств, теории графов, теории формальных семантик, логики двухместных и местных предикатов. Разработана информационная система i, предназначенная для обнаружения семантических ошибок в ГИР и управления его содержимым. Разработана базовая онтология предметной области ГИР организации. Разработана методика и алгоритмы обнаружения семантических ошибок в ГИР путем проверки семантической целостности семантической сети. Разработанные в ходе диссертационного исследования модели, методы и алгоритмы используются в программных системах управления информационным ресурсом нескольких промышленных предприятий ОАО Автомобильный завод Урал, ЗАО Интерсвязь, Челябинский государственный университет. Автоматизированные системы управления промышленным предприятием АСУПП , г. Международная научнопрактическая конференция i Ii , I , г. Российская научнопрактическая конференция Реинжиниринг бизнеспроцессов на основе современных информационных технологий. Системы управления знаниями РБПСУЗ , г. Международная научнопрактическая конференция i Ii , I , г. Основные положения исследования нашли отражение в 8 публикациях, в том числе в сборниках научных трудов и материалах научнопрактических конференций. ГЛАВА 1. Анализируя свойства ГИР необходимо рассмотреть три его основные составляющие текст, гипертекст, и информационный ресурс. Соединив основные свойства этих трех понятий, получим определение собственно предмета исследования. Определим, что под приставкой гипер понимается структурный аспект ГИР, понятие текст используется без изменений, а термин информация как семантика смысл содержимого ресурса. Когнитивная психология, изучающая процесс передачи знаний, полагает, что мышление человека основано на ассоциативном принципе, а линейная структура речи является для сознания искусственной. В весьма упрощенной модели автор идет от сети идей к линейному тексту, а читатель осуществляет обратную трансформацию линейного текста в сеть идей. Под гипертекстом пишет Нельсон я понимаю непоследовательную запись. Обычно процесс письма осуществляется последовательно по следующим двум причинам. Вопервых, потому, что он является производным от речи. Однако мысли образуют структуры, которые не являются последовательными они связаны многими возможными переходами. Гипертекст нашел свое воплощение как основной способ представления информации в сети 1п1ете1.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.211, запросов: 244