Интеграция и поиск распределённых данных на основе Semantic Web технологий

Интеграция и поиск распределённых данных на основе Semantic Web технологий

Автор: Сысоев, Тимофей Михайлович

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Москва

Количество страниц: 105 с. ил.

Артикул: 3314654

Автор: Сысоев, Тимофей Михайлович

Стоимость: 250 руб.

Интеграция и поиск распределённых данных на основе Semantic Web технологий  Интеграция и поиск распределённых данных на основе Semantic Web технологий 

Оглавление
Введение.
Актуальность исследований.
Цель исследований.
Научная новизна.
Практическая ценность.
Содержание работы.
Общая характеристика
1 Подходы к интеграции данных
1.1 Архитектуры интегрирующих систем
1.2 Построение канонической схемы.И
1.3 Обработка запросов.
2 Интеграция данных с помощью онтологий.
2.1 Описание информационных источников.
2.2 Понятия канонической схемы данных
2.3 Вспомогательная метаинформация.
2.3.1 Индекс
2.3.2 Описатель коллекции.
2.3.3 Поддержка обмена
2.3.4 Управляющая информация
2.4 Операции распределнной информационной системы.
2.4.1 Локальный поиск.
2.4.2 Совместный поиск
2.4.3 Выгрузка данных.
2.4.4 Загрузка данных.
2.4.5 Индексирование
2.4.6 Создание описателя
2.4.7 Оценка запроса по индексу.
2.4.8 Оценка запроса по описателю.
2.5 Реализация операций
2.5.1 Локальный поиск.
2.5.2 Совместный поиск
2.5.3 Обмен данными.
2.5.4 Индексирование
3 Применение разработанных моделей и технологий.
3.1 Применение в ЕНИП.
3.1.1 Статистическая информация.
3.1.2 Поиск.
3.1.3 Распределнный совместный поиск.
Заключение
Литература


Источники работают на различных аппаратных платформах, используют различное программное обеспечение, имеют различные интерфейсы доступа (CGI,RMI,CORBA,SOAP). В последнее время на подходы к интеграции данных большое влияние оказывает инициатива Semantic Web ([]). В частности, в рамках этой инициативы были предложены формат данных (XML), модель данных (RDF) и стандарты описания схем данных (RDFS,OWL), которые позиционируются как средства обмена информацией, данными, и знаниями с учётом их семантики. Целью работы является разработка моделей и технологий создания информационных систем, предназначенных для поиска и интегрирования данных, содержащихся в распределённых неоднородных информационных источниках, с применением технологий Semantic Web. Исследование и сравнительный анализ существующих подходов и моделей поиска данных и интеграции данных распределённых неоднородных информационных систем. Формализация основных операций в распределённой системе (поиск, совместный поиск, обмен). Создание моделей выполнения операций и разработка алгоритмов их реализации. Разработка технологии построения интегрирующей информационной системы на основе модели данных RDF/RDFS. Реализация компонентов информационной системы, соответствующей выбранным моделям, методам и технологиям в виде комплекса программ. Практическая ценность данной работы состоит в том, что разработанные модели и алгоритмы позволяют создавать интегрирующие информационные системы, эффективно решающие поставленные перед ними задачи. Предложенные решения были применены на практике в нескольких информационных системах, наиболее масштабной из которой на текущий момент является Единое Научное Информационное Пространство (ЕНИП) -инициатива, направленная на предоставление унифицированного доступа к интегрированной научной информации институтов РАН. В первой главе приведен обзор существующих методик построения систем, предоставляющих пользователям интегрированный доступ к данным, хранящимся в различных информационных источниках. Рассмотрены подходы к решению проблем, вызванных автономностью и разнородностью источников. Во второй главе представляется подход к интеграции данных информационных систем, основанный на использовании онтологий источников данных. Приведены отличия данного подхода от классических методов, описаны используемые модели данных и метаданных, набор операций, и предложены алгоритмы их реализации. В третьей главе описано применение разработанных решений на практике. Основное внимание уделено инициативе ЕНИП (Единое Научное Информационное Пространство) РАН. В заключении приводятся основные результаты, полученные в рамках этой работы. Работа изложена на 7 страницах. Под интеграцией данных, в соответствии с [1], мы будем понимать задачу объединения данных, расположенных в различных источниках, и предоставление доступа к единому представлению результата этого объединения. Пользователи таких систем могут получить интересующую их информацию, как если бы она была расположена в одном источнике. Можно выделить несколько различных подходов к построению систем, интегрирующих данные. В зависимости от того, посылаются ли запросы пользователя информационным источникам при обращении к интегрирующей системе, выделяют системы с виртуальной интеграцией (virtual view), и системы, в которых интегрированные данные собираются заранее, и хранятся централизованно {materialized view). Возможен также гибридный подход, когда только часть интегрированных данных хранится централизованно. Гибридный подход позволяет для некоторых выбранных классов запросов получить информацию быстрее, чем в системе с виртуальной интеграцией, за счёт отсутствия необходимости обращения к информационным источникам. Централизованный подход предполагает предварительный сбор некоторой отфильтрованной информации из источников, с последующей записью в центральное хранилище. Запросы пользователей затем выполняются в этом хранилище. Решения о том, какая информация будет собираться, какие представления будут материализованы, какая у хранилища будет схема, принимаются на этапе разработки. Обычно, централизованный подход применяется для поддержки решений.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.280, запросов: 244