Повышение эффективности автоматизированного документального поиска в гипертекстовых ресурсах Интернет

Повышение эффективности автоматизированного документального поиска в гипертекстовых ресурсах Интернет

Автор: Козлов, Артем Владимирович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2005

Место защиты: Москва

Количество страниц: 138 с. ил.

Артикул: 2770843

Автор: Козлов, Артем Владимирович

Стоимость: 250 руб.

Содержание
Введение.
Глава 1.Проблемы автоматизации документального поиска в гипертекстовых ресурсах Интернет.
1.1 Структура гипертекстовых ресурсов Интернет О
1.2 Анализ современных средств поиска в гипертекстовых ресурсах
Интернет
1.3 Методы оценки эффективности автоматизированного документального
1.4 Выводы и постановка задачи.
Глава 2.Повышение эффективности поиска информации в ресурсах Интернет на основе методов автоматического индексирования.
2.1 Задача автоматического индексирования гипертекстовых документов
2.2 Анализ моделей документального поиска
2.3 Разработка метода определения весов терминов в документах
2.4 Методика автоматического индексирования
2.5 Исследование эффективности предложенного метода определения весов
терминов
Глава 3.Разработка методики автоматизированного формирования запроса
3.1 Поиск информации с уточнением запроса
3.2 Разбиение документов на группы.
3.3 Выделение ключевых терминов в кластерах документов.
3.4 Методика автоматизированного формирования запроса
3.5 Исследование эффективности методики автоматизированного
формирования запроса.
Глава 4. Применение разработанных методов автоматизированного документального поиска в задачах информационноаналитического обеспечения.
4.1 Автоматизация поиска и отбора Интернетресурсов в системе анализа инновационных проектов.
4.2 Применение разработанных,методов при создании агентов Интернет 0 Выводы.
Заключение
Литература


Предлагается усовершенствованный метод оценки весов терминов в документах на основе анализа существующих методов, и обобщенный алгоритм автоматического индексирования с учетом предложенного метода. Исследуется эффективность предложенного метода. В третьей главе рассматриваются вопросы автоматизированного формирования запроса. Разбирается задача разбиения документов на группы. Приводится анализ методов автоматической кластеризации документов. Предлагается метод определения весов терминов в кластерах документов. Предлагается методика автоматизированного формирования запроса на основе кластеризации результатов поиска с использованием разработанного метода оценки весов терминов. Исследуется эффективность предложенной методики. В четвертой главе рассматривается использование разработанных методов для решения практических задач. Рассматривается информационно-аналитическая система, использующая разработанные методы, и применение разработанной методики в поисковых агентах Интернет. В заключении подводятся итоги проделанной работы. Перечисляются основные результаты диссертации и следующие из них выводы. Глава 1. В основе гипертекстовых ресурсов Интернет и гипертекстовых ресурсов вообще лежит идея ассоциативно-навигационного подхода к анализу текстовой информации. Ее автором считается Ванневар Буш, который в своей статье “Как мы могли бы мыслить”, опубликованной еще в году, предложил проект создания технической системы, обеспечивающей ассоциативное связывание текстов. В этой работе Буш пишет о хранении и организации данных: "Наши методы передачи и обозрения результатов научных исследований являются невероятно устаревшими и совершенно неадекватными своему предназначению. Когда данные любого характера помешаются в хранилище, они организуются в алфавитном или цифровом порядке, и информация (если таковая имеется) отыскивается путем прослеживания от подкласса к подклассу. Существуют правила, определяющие, в какой ветви должна располагаться информация, и эти правила являются обычно громоздкими. Более того, обнаружив одну единицу хранения, приходится выходить из системы для того, чтобы войти в нее снова и пойти по новому пути. Мозг человека работает совсем не так. Он действует по ассоциативному принципу. Уловив одну мысль, он немедленно переходит к следующей, порождаемой ассоциациями мыслей в соответствии с некоторым сплетением следов в клетках головного мозга" []. Он описывает его действие в виде машины, где пользователь сможет хранить свои книги, записи и сообщения и к которой сможет обращаться, как к консультанту, с растущей скоростью и гибкостью ответов. Для этого перед ним должны находиться два элемента хранения, спроектированные на экраны. Если пользователь хочет связать два элемента, он нажимает специальную кнопку, и они соединяются. После этого в любой момент времени, когда один из них находится в поле зрения, другой может быть вызван простым нажатием кнопки. Сам термин гипертекст был введен для описания документов, выражающих нелинейную структуру идей, в противоположность традиционной линейной структуре книг и речи, Тедом Нельсоном в году []. Под гипертекстом Нельсон понимал непоследовательную запись. Процесс письма, например, осуществляется последовательно, во-первых, потому, что он является производным от речи, которая всегда последовательна, а во-вторых, потому, что книги неудобно читать иначе как последовательно. Но структуры, образуемые мыслями, не являются последовательными - они связаны многими возможными переходами. В настоящее время существует множество определений термина гипертекст: “Текст содержащий в себе ссылки на другие связанные по смыслу фрагменты того же текста или на другие тексты”, "Гипертекст можно определить как нелинейную документацию, документацию, которая ветвится и взаимосвязывается, позволяя читателю исследовать содержащуюся в ней информацию, в последовательности, которую он сам выбирает" или "Гипертекст позволяет связывать текст, аудио, фотографии, чертежи, карты, движущиеся картинки и другие формы информации в осмысленное целое, к которому может осуществляться доступ при помощи системы индексации, ориентированной на конкретные идеи, а не на конкретные слова в тексте".

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.204, запросов: 244