Методы информационного поиска и ранжирования документов в компьютерных сетях

Методы информационного поиска и ранжирования документов в компьютерных сетях

Автор: Горбунов, Андрей Леонидович

Шифр специальности: 05.13.13

Научная степень: Кандидатская

Год защиты: 2005

Место защиты: Москва

Количество страниц: 73 с. ил.

Артикул: 2772026

Автор: Горбунов, Андрей Леонидович

Стоимость: 250 руб.

СОДЕРЖАНИЕ
Введение.
1 Особенности совершенствования теоретической базы компьютерных сетей посредством развития методов информационного поиска ИП.
1.1 Место методов ИП в современных компьютерных сетях и проблема показателей качества ИП.
1.2 Анализ мегодов ИП.
1.2.1 Поисковые системы
1.2.2 Кластерный анализ
1.3 Основные направления исследований.
1.4 Заключение по главе 1.
2 Методы повышения качества ИП посредством ранжирования вебдокументов с использованием дополнительной информации о предпочтениях пользователей
2.1 Особенности организации поиска информации с учтом сведений о
предпочтениях пользователей.
2.2 Применение метода векторного пространства при поиске информации.
2.3 Совершенствование алгоритмов поиска информации с учтом сведений о
предпочтениях пользователя
2.4 Пример применения усовершенствованного поискового алгоритма с учтом
предпочтений пользователя.
2.5 Апробация разработанного метода.
2.6 Заключение но главе 2.
3 Методы повышения качества информационного поиска путм ранжирования результатов поиска с использованием статистики переходов при поиске по данному запросу.
3.1 Особенности использования статистики переходов при организации поиска
информации
3.2 Разработка процедуры ранжирования результатов поиска с учтом статистики
переходов.
3.3 Совершенствование процедуры ранжирования результатов поиска с учтом
статистики переходов
3.4 Апробация предлагаемого метода
3.5 Заключение по главе 3.
4 Ранжирование вебстраниц и сайтов но критериям привлекательности для пользователей.
4.1 Особенности использования вебсайтов предприятий при организации
рекламных кампаний
4.2 Методы математического анализа эффективности организации и использования вебсайтов компний.
4.3 Выбор математического аппарата и проверка корректности его применения.
4.4 Разработка модели ранжирования страниц одного сайта модель 1
4.5 Разработка модели ранжирования сайтов модель 2
4.6 Апробация предлагаемых моделей
4.7 Заключение по главе 4.
Стр. 3
5 Ранжирование источников новостей в Интернете но степени информативности
5.1 Особенности работы с источниками новостей
5.2 Методы категоризации и классификации новостных источников
5.3 Разработка процедур обработки новостей с использованием аппарата
дисперсионного анализа.
5.3.1 Ранжирование с помощью статистических оценок а, 5, у и 5.
5.3.2 Ранжирование с помощью дисперсионных отношений
5.3.3 Ранжирование с учтом востребованности новостных источников.
5.4 Апробация предлагаемых меотдов.
5.5 Заключение по главе 5
Заключение.
Список литературы


Gey), посвящённые поиску с использованием модели логической регрессии, а также исследования Р. Фанга (R. Fung) но байесовским моделям И П. Доминирующий в настоящее время подход к организации процедуры установления соответствия запроса и документа (метод индекса цитирования) отражен в работах С. Брина (S. Brin) и Л. Пэйджа (L. Page). Укрепляющийся интерес современных исследователей к данной тематике очевидно обусловлен информационной глобализацией, в сфере компьютерных сетей наиболее выпукло представленной феноменом Интернета. Появление огромных и общедоступных хранилищ информации с постоянным и быстрым обновлением отличающихся сильной неоднородностью данных (база данных лидера поисковой индустрии google. Тенденция лавинообразного роста информационной насыщенности сделала подсистемы ИГ1 не только неотъемлемым, но и наиболее важным элементом архитектуры компьютерных сетей. Во многих случаях центральным звеном процедур ИП является ранжирование документов (веб-страницы и сайты в случае Интернета). Стр. Без эффективного ранжирования результаты поиска теряют смысл, так как могут включать в себя ссылки на десятки и сотни тысяч документов. В целом ранжирование в Интернете носит характер всеобщего проблемного императива, поскольку обилие неупорядоченной онлайновой информации создаёт ситуацию оценки и выбора в любом аспекте использования Интернета. При этом основными проблемами разнигия научных основ архитектурных принципов компьютерных сетей в ракурсе ИП являются недостаточная теоретическая проработка применяемых на практике подходов, сравнительно невысокий уровень использования развитых математических механизмов, отставание теоретических разработок от быстро меняющихся поисковых потребностей пользователей компьютерных сетей. Нелыо настоящей диссертации является совершенствование теоретической базы компьютерных сетей на основе технологам информационного поиска. Интернете. В диссертации осуществляется теоретический анализ и экспериментальное исследование функционирования телекоммуникационных систем и компьютерных сетей для специальных приложений - ПС. Разрабатываю гея научные подходы, методы и алгоритмы для ПС. ПС, будучи объектами седьмого (прикладного) уровня эталонной модели ОБ1 0, в случае Интернета с характерным для этой среды мощным поисковым трафиком, оказывают значительное влияние на архитектуру объектов уровней 2-6 (канальный, сетевой, транспортный, сеансовый, представительный): разрабатываемые в диссертации методы снижают объём поискового трафика и, тем самым, высвобождают ресурсы уровней 2-6 для полезной нагрузки. Интернете по критерию информативности, основанный на модели, построенной с применением элементов дисперсионного анализа. С»р. Апробация полученных результатов. Основные положения диссертационный работы докладывались и обсуждались на кафедрах «Вычислительные машины, комплексы и сети» и «Радиотехнические устройства» Московского государственного Технического Университета ГА, «Вычислительная техника» Московского Государственного Института Электроники и Математики, на международной конференции «Российский Интернет Форум ». По теме диссертации опубликовано 6 печатных работ. Описываемые в диссертации методы ранжирования разработаны и апробированы автором в период работы в проекте Рубрикой (www. Рубрикой - крупнейший в мире энциклопедический Интернет-ресурс: болсс 0 тыс. БСЭ. Компания Microsoft включила встроенную функцию прямого поиска но Рубрикону в свой наиболее массовый продукт, присутствующий практически на каждом компьютере в России - пакет MS-Office (ht(p. MicrosoftOfficeSystem. Инфраструктура контент-продаж Рубрикона используется старейшей и самой известной в мире энциклопедией на английском языке -энциклопедией «Британика» - для организации доступа российских подписчиков к своим онлайновым ресурсам. Рубрикой имеет совместные проекты с лидирующей российской ПС Яндекс («Яндекс-Энциклопедии» http://encycl. Таким образом, проект Рубрикой является наиболее представительной в современных условиях средой для развития и проверки разработанных методик.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.201, запросов: 244