Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах

Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах

Автор: Люстиг, Инга Владимировна

Количество страниц: 170 с. ил.

Артикул: 3321228

Автор: Люстиг, Инга Владимировна

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Москва

Стоимость: 250 руб.

Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах  Разработка и программная реализация метода семантически-ориентированного поиска информации в электронных документах 

1. ОСНОВНЫЕ ПОДХОДЫ К ПОИСКУ ИНФОРМАЦИИ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ.
1.1. Способы поиска информации в электронных документах
1.1.1. Анализ электронных документов, основанный на их содержании
1.1.1.1. Анализ отдельных электронных документов, основанный на содержании
1.1.1.2. Анализ коллекций электронных документов, основанный на содержании
1.1.1.3. Контекст информации.
1.1.1.4. Внутренние ярлыки документов
1.1.2. Анализ документов, основанный на исследовании поведения отдельных пользователей
1.2. Семантические аннотации информационных ресурсов.
1.2.1. Язык расширенной разметки X.
1.2.2. Язык описания метаданных об информационных ресурсах .
1.2.3. Онтологии .
1.2.4. Основные схемы метаданных.
1.3. Методы построения семантических представлений текстов на естественном языке
1.3.1. Теория концептуальных графов
1.3.2. Компьютерная семантика русского языка.
1.3.3. Расширенные семантические сети
1.3.4. Неоднородные семантические сети.
1.3.5. Эпизодическая логика
1.3.6. Теория Кпредставлений
1.3.7. Выбор теории Кпрсдставлений в качестве методологической основы диссертационного исследования
1.4. Медикобиологические информационнопоисковые системы
1.5. Выводы по материалам главы
2. ПОСТАНОВКА ЗАДАЧИ ДИССЕРТАЦИОННОГО ИССЛЕДОВАНИЯ И РАЗРАБОТКА ЛОГИЧЕСКОЙ СТРУКТУРЫ ЛИНГВИСТИЧЕСКОЙ БАЗЫ ДАННЫХ.
2.1. Постановка задачи диссертационного исследования.
2.2. Краткие сведения о модели для описания системы первичных единиц концептуального уровня, предложенной в теории СКязыков
2.2.1. Общая характеристика модели
2.2.2. Основные идеи определения класса сортовых систем.
2.2.3. Типы, порождаемые сортовыми системами, и конкретизации типов.
2.2.4. Концептуальнообъектные системы
2.2.5. Система кванторов и логических связок
2.3. Формализация дополнительных предположений о рассматриваемых первичных единицах концептуального уровня.
2.4. Модель лингвистической базы данных в теории Кпредставлений
2.5. Разработка структуры лингвистической базы данных.
2.5.1. Объединенный словарь предложных и глагольнопредложных фреймов как новый компонент лингвистической базы данных.
2.5.2. Формальное определение единого словаря предложных и глагольнопредложных фреймов
2.5.3. Примеры статей единого словаря предложных и глагольнопредложных фреймов.
2.6. Общая логическая структура лингвистической базы данных.
2.7. Выводы по материалам главы 2.
3. РАЗРАБОТКА МЕТОДА СЕМАНТИЧЕСКИОРИЕНТИРОВАИИОГО ПОИСКА ИНФОРМАЦИИ В ЭЛЕКТРОННЫХ ДОКУМЕНТАХ
3.1. Основные предположения о рассматриваемом классе электронных документов
3.2. Описание алгоритма нахождения документов, в которых реализуется смысловое отношение в сочетаниях с лексической единицей, имеющей заданную базовую форму.
3.3. Описание предлагаемого метода поиска смысловых отношений.
3.3.1. Поиск участников смыслового отношения
3.3.2. Проверка отсутствия словотрицаний.
3.3.3. Детализация метода и описание алгоритма поиска смысловых отношений
3.3.3.1. Детализация метода поиска смысловых отношений
3.3.3.2. Описание алгоритма поиска смысловых отношений
3.4. Описание метода семантичсскиориентированного поиска.
3.5. Пример применения семантическиориентированного поиска.
3.6. Выводы по материалам главы 3.
4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ РАЗРАБОТАННОГО МЕТОДА СЕМАНТИЧЕСКИОРИЕНТИРОВАННОГО ПОИСКА ИНФОРМАЦИИ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ПОИСКА
ЛЕКАРСТВЕННЫХ ПРЕПАРАТОВ
4.1. Основные направления доработки метода семантическиориентированного поиска с целью его применения для поиска лекарственных препаратов .
4.2. Получение списка объектов, оказывающих воздействие на некоторый фактор.
4.3. Получение списка объектов, оказывающих воздействие на некоторый фактор, с учетом способа достижения результатов этого воздействия.
4.4. Описание основных подсистем проектируемой системы
4.5. Разработка метода и алгоритма построения семантического представления основной цели лечения заболевания, сформулированной на ограниченном русском языке.
4.5.1. Структура семантического представления для описания основной цели лечения заболевания.
4.5.2. Метод и алгоритм преобразования выражения об основной цели лечения заболевания, сформулированного на ограниченном русском языке, в его семантическое представление.
4.5.2.1. Описание метода преобразования выражения об основной цели лечения заболевания, сформулированного на ограниченном русском языке, в его семантическое представление.
. Описание алгоритма преобразования выражения об основной цели лечения заболевания, сформулированного на ограниченном русском языке, в его семантическое представление.
4.6. Выбор средств для программной реализации поисковой системы СЕМПМЕД.
4.7. Словари морфологии.
4.7.1. Морфологический анализ и способы его реализации
4.7.2. Словари морфологии проекта ДИАЛИНГ.
4.7.3. Словари морфологии в системе СЕМПМЕД.
4.8. Логическая структура лексикосемантического словаря
4.9. Реализация единого словаря предложных и глагольнопредложных семантикосинтаксических фреймов
4.9.1. Предложные и глаголыюпредложные семантикосинтаксические фреймы.
4.9.2. Структу ра единого словаря предложных и глагольнопредложных семантико
синтаксических фреймов.
4 Вариант структуры для хранения текстов описаний объектов.
4 Метод получения обобщенных параметров дтя параметра запроса пользователя
4 Выявление разделов текста описания объекта для поиска данных
4 Поиск параметра запроса в текстах описаний объектов.
. Цель осуществления поиска параметра запроса в текстах описаний объектов
. Компонент i x ii компании ГарантПаркИнтернет для СУБД .
4 Алгоритм определения целесообразности семантического анализа фрагмента текста
4 Извлечение предложения из фрагмента текста
4 Связь смысловых отношений с видами пользовательских запросов
4 Поиск смысловых отношений.
. Поиск участников смыслового отношения.
. Проверка отсутствия словотрицаний
. Детализация метода и алгоритма поиска смысловых отношений с учетом предлагаемой структуры лингвистической базы данных
.1. Детализация метода поиска смысловых отношений с учетом предлагаемой структуры лингвистической базы данных
.2. Детализация вычисления значений основных вспомогательных структур для алгоритма поиска смысловых отношений с учетом предлагаемой структуры лингвистической базы данных.
4 Использование семантического представления выражения об основной
цели лечения заболевания для поиска лекарственных препаратов
4 Общая логическая структура лингвистической базы информационнопоисковой системы СЕМПМЕД.
4 Сведения об информационнопоисковой системе СЕМПМЕД.
4 Анализ возможностей адаптации к другим предметным областям
. Анализ возможностей и способы адаптации к другим предметным областям, в том числе в области косметологии
. Анализ возможностей применения разработанного метода семантическиориентированного поиска в области юриспруденции.
4 Применение результатов диссертационного исследования на предприятии
. Информация о предприятии
. Цели внедрения ИПС СЕМПМЕД на предприятии.
. Результаты применения.
4 Выводы по материалам главы 4.
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Так, при выявлении причины появления в сообщении, рассматривает позицию в этом документе. Если является частью подписи отправителя, то предполагается, что это ссылка на его домашнюю страничку, а не рекомендация к просмотру указанного сайта. В случае если находится в разделе, заключенном в кавычки, то эта ссылка также не считается советуемой. Разрабатываемые в последнее время фильтрующие системы в большей степени нацеливаются на оценку и анализ содержания иили структуры не отдельных документов, а целых коллекций. Например, сетевой робот Раерске, просматривает различные сайты сети и записывает, сколько встречается ссылок на определенный документ. Такой подход можно обосновать тем, что чем большее количество авторов страничек считают этот ресурс стоящим того, что бы поставить на него ссылку, тем более ценным в некотором смысле является этот документ. Система Раерске, ищет в коллекции документов, являющиеся полными или частичными зеркалами другого сайта. Такие зеркальные сайты можно рассматривать как структурную особенность интернетколлекции. Принимая во внимание структуру коллекции, зеркальные сайты могут быть признаны более ценным, чем исходные сайты, для которых не проводятся меры для дальнейшего выживания иили не совершенствуются механизмы работы. Это объясняется тем, что такие рассылки, как правило, являются рекламой. Таким образом, такой анализ в некоторых случаях может быть использован для определения жанра документов. Раерске, . Контекстом является издатель документа, например, НьюЙорк Таймс, консорциум i . Примером контекста также служит время издания документа, так, материал, опубликованный в ые годы, для многих целей не подходит, так как он основывается на ситуации того времени, в отличие от современных изданий. Контекст документа иногда можно определить просто путем исследования некоторых доступных аспектов этого ресурса. Например, анализ страницы может дать явное указание на то, что документ опубликован НьюЙорк Таймс. С другой стороны, выявление основной темы документа для включения се в тематический контекст, требует дополнительного косвенного анализа. Под тематическим контекстом документа подразумевается предмет его обсуждения семантически. Тематический контекст отличается от жанра документа, который связан с поверхностными особенностями документа и с его стилем, т. Когда контекст документа установлен и записан в коллекцию метаданных, на его основании, с помощью ранее описанных способов, рассматриваемому источнику присваивается оценка. К примеру, материалы НьюЙорк Таймс могут быть оценены выше публикаций неизвестных изданий. Похожим образом, многие информационные системы по умолчанию в списке результатов запроса сначала отображают более новые публикации. Разновидностью смысловой фильтрации является случай, когда дата издания является временным контекстом, по которому могут делаться заключения о ценности информационного ресурса. Конечно, решение о том, какой контекст является болсс важным, зависит от конкретной задачи или от личных предпочтений. Для историка большую ценность может представлять информация с более ранним временным контекстом, в то время как технология анализа может присвоить большую ценность новым публикациям. Поэтому фильтрующие машины должны быть настраиваемыми. Контексты и их оценки могут, следовательно, быть зависящими от пользователя. Это реализовано в еще одном примере подхода, основанного на содержании. Раерске, . Частью процесса регистрации является поиск подсистемой извлечения метаданных тех документов , которые содержат имя регистрируемого, а затем в том же документе отыскиваются имена, расположенные в непосредственной близости. К примеру, в результате могут быть найдены соавторы публикаций, лица, с которыми осуществляется обмен новостями, а так же ссылки с их домашних страниц. Далее система единожды или дважды рекурсивно повторяет этот процесс для связанных личностей, найденных на первом шаге работы. Когда регистрация закончена, поисковый фильтр готов к работе. Коллекция метаданных представляет собой сетевой граф.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.236, запросов: 244