Модели и методы поиска информационных ресурсов с использованием семантических технологий

Модели и методы поиска информационных ресурсов с использованием семантических технологий

Автор: Нгуен Ба Нгок

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2012

Место защиты: Томск

Количество страниц: 198 с. ил.

Артикул: 6506039

Автор: Нгуен Ба Нгок

Стоимость: 250 руб.

Модели и методы поиска информационных ресурсов с использованием семантических технологий  Модели и методы поиска информационных ресурсов с использованием семантических технологий 

ВВЕДЕНИЕ.
ГЛАВА 1. ОБЗОР МОДЕЛЕЙ ИНФОРМАЦИОННОГО ПОИСКА
1.1. Постановка задачи информационного поиска.
1.2. Классические модели информационного поиска.
1.2.1. Булевый поиск
1.2.2. Модель векторного пространства.
1.2.3. Вероятностная модель.
1.3. Дополнительные модели информационного поиска.
1.3.1. Модель нечетких множеств.
1.3.2. Модель обобщенного векторного пространства.
1.4. Оценки эффективности системы информационного поиска
1.4.1. Полнота и точность.
1.4.2. Нормализованное расстояние между результатами
1.5. Выводы.
ГЛАВА 2. ПРИМЕНЕНИЕ СЕМАНТИЧЕСКИХ ТЕХНОЛОГИЙ В РЕШЕНИИ ЗАДАЧИ ПОИСКА ИНФОРМАЦИИ
2.1. Семантические технологии.
2.1.1. Мотивация
2.1.2. Методы представления знаний
2.1.3. Классификация онтологии
2.2. Подходы поиска информаций на основе семантики
2.2.1. Семантические методы, разрабатываемые в области информационного поиска.
2.2.2. Методы семантического поиска, разрабатываемые в области создания семантической вебсети
2.2.3. Классификации подходов семантического поиска.
2.2.4. Ограничения подходов семантического поиска.
2.3. Выводы.
ГЛАВА 3. ПРЕДЛАГАЕМАЯ МОДЕЛЬ СЕМАНТИЧЕСКОГО ПОИСКА ИНФОРМАЦИИ НА ОСНОВЕ МЕТАОПИСАНИЙ.
3.1. Семантическое обеспечение системы.
3.1.1. Математическая модель онтологии предметной области
3.1.2. Семантические модели объектов знания
3.2. Логические представления документов и запросов
3.2.1. Набор триплетов.
3.2.2. Концепция ЯйРграфов
3.3. Методы семантической близости.
3.3.1. Оценка семантической близости между компонентами триплетов
3.3.2. Семантическая близость между триплетами.
3.3.3. Семантическая близость между документами и запросами
3.4. Пример вычисления семантической близости
3.5. Оптимизация обработки запросов
3.6. Выводы
ГЛАВА 4. АРХИТЕКТУРА СИСТЕМЫ СЕМАНТИЧЕСКОГО ПОИСКА
4.1. Общая схема процесса поиска информации
4.2. Формирование метаописании
4.2.1. Ручное формирование метаописаний.
4.2.2. Полуавтоматическое формирование метаописаний.
4.3. Структуры индексов и алгоритмы индексирования
4.3.1. Поиск элементов онтологии с помощью Зв
4.3.2. Оптимизация хранения триплетов с использованием числовых идентификаторов.
4.3.3. Индексирования базы знания с помощью системы Ьисепе
4.3.4. Представление онтологии предметной области в виде графа.
4.3.5. Индексирование метаописаний
4.4. Программная реализация
4.5. Выводы
ГЛАВА 5. ИССЛЕДОВАНИЯ АЛГОРИТМОВ.
5.1. Метод оптимизации хранения ii триплетов
5.1.1. Эксперимент 1 объем оперативной памяти.
5.1.2. Эксперимент 2 время поиска триплета
5.2. Алгоритмы вычисления сем.антической близости
5.2.1. Эксперимент 3 оценка близости между понятиями
5.2.2. Эксперимент 4 близость между метаописаниями
5.4. Выводы
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА


С одной стороны, у человека - пользователя есть информационная потребность, представляемая некоторым требованием, которое затем преобразуется в поисковую фразу (запрос). С другой стороны, в поисковых северах имеются коллекции электронных ресурсов, которые индексированы для цели автоматической обработки. При этом важно отметить, что релевантность имеет субъективный характер, т. В настоящее время существует большое количество поисковых систем. Однако практически все они имеют общую архитектуру, которая представлена на рис. Рис. Индексирование - сбор электронных ресурсов и создание их логических представлений, а также хранение логических представлений с использованием индексов (оптимизировашгых структур данных для быстрого выполнения поиска). Формирование запросов - описания информационных потребностей пользователя на языке, поддерживаемом поисковой системой. Сравнение - вычисление оценок близости (релевантности) между запросами и документами. На основе оценок релевантности определяется множество результатов, которое затем возвращается пользователям. Связь между системными сообщениями и подсистемой формирования запроса означает возможность использования результатов поиска для уточнения запроса. Отмечается, что любая система информационного поиска обычно реализуется на основе соответствующей теоретической модели, в которой описываются ее основные особенности: логическое представление документов и информационных потребностей, а также алгоритмы вычисления оценки релевантности между логическими представлениями запросов и документов. При анализе модели имеется возможность прогнозировать множество результатов заданного запроса и обосновать релевантности полученных документов. Model = [Д Q. F, R(q{, dj)], где D - множество логических представлений документов коллекции; Q -множество логических представлений информационных потребностей пользователя (запросов); F - платформа для моделирования представлений документов, запросов и отношения между ними; R(dit qj) - функция ранжирования, задающая вещественное число для запроса и представления документа dj -функция близости. Данное ранжирование определяет степень (порядок) соответствия документов запросу qt. Например, для классической модели булевого поиска такая платформа включает множество документов и набор стандартных операций над множествами. Для классической модели векторного пространства платформа включает /-мерное векторное пространство и стандартные операции линейной алгебры. Для классической вероятностной модели данная платформа включает множества, стандартные операции вероятностей и теорему Байеса. Нулевая модель информационного поиска получила широкую популярность в середине девяностых годов прошлого века. Главной причиной этого, с одной стороны, является то, что данная модель является достаточно простой и интуитивно понятной, а с другой - то, что в те времена еще не были разработаны альтернативные подходы. Нулевая модель основана на теории множества и булевой алгебре. Запросы данной модели формируются как булевые выражения. Поисковый алгоритм в булевой модели основан на бинарном критерии решения, который заключается в том, что документы могут быть только либо релевантными, либо нерелевантными заданному запросу. В булевой модели поиска документ представляется в виде бинарного вектора терминов, определяющего принадлежность терминов искомым документам. Запрос представляет собой список ключевых слов (терминов), объединенных булевыми операторами (И, ИЛИ и НЕ (А, V, •-)). Для описания сложных запросов требуется использовать скобки для группировки операций. Например: в запросе [а а Ъ V с] требуется уточнить порядок выполнения операций: [(а л Ь) V с] или [а а (Ь V с)]. В данной модели существует небольшая семантическая путаница между операторами «И» и «ИЛИ». На естественном языке выражение «А и Б» обычно ссылается на большее количество предметов, чем только А или Б отдельно, однако в булевой логике этот выражение ссылается на меньшее количество предметов []. Булсвое выражение может быть представлено как объединение (операция V) набора операции пересечения (операция а). А Ь) V (а л ’-с).

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.228, запросов: 244