Моделирование и разработка средств и технологий поиска документальной информации

Моделирование и разработка средств и технологий поиска документальной информации

Автор: Голицына, Ольга Леонидовна

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Москва

Количество страниц: 208 с. ил.

Артикул: 2626076

Автор: Голицына, Ольга Леонидовна

Стоимость: 250 руб.

СОДЕРЖАНИЕ
Введение
Глава 1. Структурнометодологические основы информационнопоисковых систем.
1.1. Информация в системах основной и информационной деятельности.
1.2. Человекомашинный информационный поиск в документальных БД.
1.3. Типология информационной неопределенности и видов информационного поиска.
1.4. Обобщенная схема и средства информационного поиска.
1.4.1. Обобщенная схема информационного поиска
1.4.2. Средства и интерфейсные объекты в поисковых технологиях
1.4.3. Использование словарных и рубрикационных структур при подготовке и обработке запроса
1.4.4.Средства поиска, обеспечивающие нормализацию лексики ИПЯ
1.4.5.0ценка и обработка результатов поиска.
Выводы по первой главе
Глава 2. Модели и алгоритмы информационного поиска в документальных
2.1. Матрица терминдокумент как основа реализации поисковых механизмов.
2.1.1. Модель механизма поиска по совпадению терминов.
2.1.2. Модель механизма поиска по логическому выражению.
2.1.3. Модель механизма поиска с использованием контекстных операций
2.1.4. Модели механизма поиска по сходству
2.1.4.1. Модель механизма поиска документованалогов
2.1.4.2. Модель механизма эвристического поиска.
2.1.4.3. Модель механизма поиска с использованием обратной связи по релевантности терминов
2.2. Взаимосвязь моделей механизмов поиска
2.3. Алгоритмическая реализация моделей механизмов поиска.
2.3.1. Базовые процедуры работы с матрицей терминдокумент
2.3.2. Алгоритм процедуры поиска по совпадению терминов.
2.3.3. Алгоритм процедуры поиска по логическому выражению.
2.3.4. Алгоритм процедуры поиска аналогов.
2.3.5. Алгоритм процедуры эвристического поиска.
2.3.6. Алгоритм процедуры поиска с использованием обратной связи по релевантности терминов
Выводы по второй главе
Глава 3. Средства лингвистической поддержки информационного поиска в
документальных БД.
3.1. Логика ИПЯ.
3.2. Статистические меры близости.
3.3. Исследование эффектвности мер, основанных на структурночастотных характеристиках
3.3.1. Алгоритм построения иерархических словарных структур.
3.3.2. Ранжирование терминов словаря для расширения поискового запроса
в технологии обратной связи
3.3.3. Оценка эффективности использования интегрального коэффициента
при ранжировании терминов для расширения запроса.
Выводы по третьей главе
Глава 4. Реализация поисковых моделей и лингвистических средств в
документальной И ПС
4.1. Логическая структура документальной базы данных.
4.2. Физическая структура документальной базы данных.
4.3. Информационнопоисковый язык документальной ИПС.
4.4. Синтаксис и семантика использования дескрипторов
4.5. Средства формирования запросов
4.6. Реализация технологий поиска документов по сходству.
4.7. Технологические объекты для построения предложения запроса
4.8. Схема и средства развития поискового процесса.
Выводы по четвертой главе
Заключение.
Список литературы


Носителем информации этого уровня является человеческое сознание, для которого характерны системность организации и ассоциативность выборки, а коммуникационным объектом является сообщение - знание, адресно отраженное на систему понятий предполагаемого приемника - потребителя информации. Второй уровень - создание общественно-полезной информации - одна из форм овеществления знаний через обобществление результатов в документальной форме. Средством представления знаний (коммуникаций) здесь является язык, а носителем -документ как функционально ориентированное сообщение, структурирующее информацию и идентифицирующее ее, например, путем выделения логических или физических частей - семантически однородных полей. Третий уровень - собственно информационная деятельность - управление потоками информации для обеспечения основной деятельности. Работа с компактными по объему вторичными документами, позволяющими совершенствовать процесс поиска нужных сообщений. Здесь информация (поисковый образ документа) - это хорошо структурированный материал, компактно и предметно отражающий содержание документа, а также обеспечивающий идентифицируемость документа в целом и на уровне отдельных элементов данных. Для определения взаимосвязи информационных объектов используем понятие «информация» [7, ], которая представляется как отражение, результат упорядочения и ограничения разнообразия описаний объектов ОД и их взаимосвязей (в реальном мире) в соответствии с требованиями, определяемыми возможностями средств представления (языка описания). Отсюда следует, что использование абстракций различного порядка в итоге дает возможность представлять объекты (упрощая описание объекта одного семантического уровня за счет введения объектов другого уровня) с помощью конечного числа терминов. Соотношение и характер взаимосвязей информационных объектов, форм и средств их представления, рассматриваемых в контексте задач информационного обеспечения основной деятельности, приведены на рис. Сообщение ь Язык научи. Рис. Здесь преобразование форм представления информации является последовательным отражением содержания, а но существу - фильтрацией информации путем снижения разнообразия форм и аспектов представления смыслового содержания через фиксацию характера выражения, т. Например, сообщение предполагает фиксацию (ограничение) предметной области; документ - фиксацию вариантов способа представления через выделение семантически однородных полей и, соответственно, определение характера и способа их наполнения; поисковый образ фиксирует способы указания значения отдельного элемента (типа данных). Соответственно, адекватность средств отражения информации (а в случае информационно-поисковых систем - это лингвистическое обеспечение) должна рассматриваться как с точки зрения возможности нсискажающего преобразования самой информации в цепи генерации-потребления информационного ресурса, так и с точки зрения адекватности восприятия пользователем возможностей этих средств. Для рассматриваемых в работе документальных систем (документы, как отражение результатов интеллектуальной деятельности) обрабатываемые объекты имеют преимущественно абстрактную природу. ОД. Именно введение такой систематической составляющей позволяет снизить размерность задачи идентификации объектов и выделения преобразуемой части среды за счет абстрагирования от конкретики ситуационной составляющей, представляя ее в виде отдельной структурной информационной компоненты7. Таким образом, информационная модель любой системы, ориентированной на взаимодействие, необходимо включает компоненты двух типов - множество сообщений, отражающих актуальное состояния среды, и множество сообщений о системообразующем основании, выбранном для построения этой модели. Для систем управления материальными объектами такая структурная составляющая представляется, например, опытом или сводами принципов и правил; для систем преобразования объектов в идеализированной форме - это законы природы и научные принципы; для систем управления информационными потоками - это метаинформация: тезаурусы, классификаторы и т.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.455, запросов: 228