Использование связей между web-страницами и закономерностей рассеяния информации для повышения эффективности поиска в WWW

Использование связей между web-страницами и закономерностей рассеяния информации для повышения эффективности поиска в WWW

Автор: Нгуен Куанг Чунг

Шифр специальности: 05.13.13

Научная степень: Кандидатская

Год защиты: 2002

Место защиты: Москва

Количество страниц: 125 с. ил

Артикул: 2282445

Автор: Нгуен Куанг Чунг

Стоимость: 250 руб.

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
Глава 1. Поиск информации в . Методы оценки релевантности
страниц, выдаваемых поисковой машиной
1.1 Представление в виде графа
1.2 Поисковые системы в и проблема оценки релевантности страниц. выдаваемых поисковой машиной.
1.2.1 Каталог и поисковая машина.
1.2.2 Поисковые машины и проблема оценки релевантности ответа
1.3 Индекс научного цитгцювания I и используемые им типы связей между научными публикациями.
1.4 Методы оценки релевантности страниц, учитывающие связи между ними в
1.4.1 Релевантность документа и критерии для оценки релевантности.
1.4.2 Первые попытки учета связей между страницами для оценки релевантности ответов, выдаваемых поисковой машиной.
1.4.3 Метод I и его модификации.
1.4.4 Метод .
1.4.5 Анализ существующих методов
1.5 Результаты и выводы.
Глава 2. Разработка новых методов для повышения эффективности
поиска в с использованием связей между страницами и закономерностей рассеяния информации
2.1 Модель процесса броузинга с возвратом.
2.2 Улучшение оценки релевантности страниц на основе учета связей между ними по отдельной теме.
2.3 Применение закона рассеяния информации Бедфорда для
формирования ядра информационного потока
2.4 Структурная схема усовершенствованной поисковой машины
2.5 Результаты и выводы.
Глава 3. Применение разработанных методов при поиске в Интернете информации по теме железнодорожный транспорт.
3.1 Методика эксперимента.
3.2 Полученные результаты.
3.2.1 Количество страниц по теме железнодорожный транспорт в зонах рассеяния информации.
3.2.2 Словарь терминов и терминподмножества в
3.2.3 Оценки релевантности, вычисленные по методам , I и МОРСТ
3.3 Формирование ядра информационного потока по теме
железнодорожный транспорт в .
3.4 Анализ полученных результатов.
3.5 Результаты и выводы.
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА


Целью диссертационной работы является использование связей между уеЬ-страницами и закономерностей рассеяния информации для повышения эффективности поиска в VVW. Применение разработанных методов для поиска информации в VVW по теме «железнодорожный транспорт». Предметом исследования являются методы оценки релевантности veb-страниц, учитывающие связи между ними. Объектом исследования являются информационные системы, содержащие сеть ссылок, такие, как гипертексты и ссылки цитирования. В нашем случае, это информационное пространство VVW. Методологической основой* диссертационного исследования являются научные труды ученых по компьютерным сетям, теории вероятности, теории информации, гипертексту и методам оценки релевантности для поисковой машины в WWW. Научная новизна работы состоит в развитии и разработке новых научно обоснованных методов для повышения эффективности поиска в WWW, учитывающих связи между web-страницами и закономерностей рассеяния информации. Практическая значимость диссертационного исследования состоит в том, что отдельные результаты диссертации могут быть использованы в учебных курсах «Структура данных» и «Сети ЭВМ» при подготовке студентов технических университетов по специальности «ЭВМ, комплексы, системы и сети», а также для разработки новой поисковой машины, позволяющей более эффективно осуществлять поиск информации. Основные положения работы докладывались на научно-технической конференции «Неделя науки », на шестой Международной научно-практической конференции «Информационные технологии на железнодорожном транспорте - Infotrans ». Основные положения диссертации отражены в 3 научных публикациях общим объемом 2. Диссертация состоит из введения, трех глав, заключения, списка использованной литературы ( наименований) и приложений. В работе представлено 2 схемы, рисунков, таблиц, 6 приложений. Глава 1. Поиск информации в WWW. Методы оценки релевантности web-страниц, выдаваемых поисковой машиной. Последние годы отмечены бурным ростом Интернета, как всемирного средства доступа к различной информации. Центральным компонентом Интернета является «всемирная паутина» WWW (World Wide Web). WWW представляет собой огромный массив документов, фрагментами которых могут быть тексты, изображения, звуки, видеофрагменты и видео-репортажи в реальном масштабе времени. Система WWW построена по модели «клиент-сервер». Документы хранятся на распределенных по всей сети WWW-серверах, а пользователи обращаются к ним при помощи клиентских программ - броузеров, обеспечивающих запрос документа, его прием или другие обработки. Обращение к документам WWW происходит по протоколу HTTP (Hypertext Transfer Protocol), позволяющему в асинхронном режиме передавать информацию по запросам пользователя. Вся система WWW имеет единое адресное пространство, в котором каждый документ снабжен уникальным адресом, так называемым URL (Universal Resource Locator). URL каждого документа состоит из двух частей: «адрес WWW-сайта» или уникальный IP-адрес сервера (Internet Protocol), хранящего этот документ и локальный адрес документа на этом сервере. Стандартным способом описания документов в WWW является использование гипертекстового языка разметки страниц HTML (Hypertext Markup Language), с помощью которого определяется внешнее представление текстовых, графических и других мультимедийных фрагментов, а также установление связей между этими документами. Документы в WWW называются web-страницами. Таким образом, WWW рассматривается как гипертекстовая система. Имеется ряд научных работ, связанных с исследованием [, , ], моделированием (, , , , , ] гипертекста и разработкой новых методов его применения в построении информационных систем [, ]. Однако, быстрое развитие новых гипертекстовых информационных систем, в том числе VWV, ставит перед учеными новые задачи, связанные с проблемой поиска информации в них. На рис. VWV []. Видно, что пользователю, находящемуся в центре картины, очень трудно ориентироваться и искать необходимую информацию в этом огромном гипертекстовом пространстве. Рис.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.205, запросов: 244