+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа

Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа
  • Автор:

    Лукашевич, Наталья Валентиновна

  • Шифр специальности:

    05.25.05

  • Научная степень:

    Докторская

  • Год защиты:

    2014

  • Место защиты:

    Москва

  • Количество страниц:

    312 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
Глава 1. Использование знаний в приложениях 
1.1. Формальные и лингвистические онтологии



СОДЕРЖАНИЕ

Введение

Глава 1. Использование знаний в приложениях

информационного поиска

1.1. Формальные и лингвистические онтологии

1.1.1. Информационно-поисковые тезаурусы

1.1.2. Тезаурусы типа VordNet


1.2. Методы применения лингвистических онтологий в приложениях обработки неструктурированной информации

1.2.1. Автоматическое концептуальное индексирование на


основе информационно-поисковых тезаурусов
1.2.2. Автоматическое разрешение многозначности
1.2.3. Тезаурусы типа VordNet в информационном поиске
1.2.4. Лингвистические онтологии в вопросно-ответных
системах
1.2.5. Лингвистические онтологии в системах
автоматической рубрикации текстов
Заключение к главе 1
Глава 2. Модель лингвистической онтологии для
автоматической обработки текстов
2.1. Основные принципы разработки лингвистических ресурсов
для автоматического концептуального индексирования
2.2. Модель отношений в ЛО
2.2.1. Таксономическое отношение еыше-тисе
с! -г
2.2.2. Отношение онтологической зависимости
2.2.3. Отношение часть-целое
2.2.4. Отношение внешней онтологической зависимости в модели

2.2.5. Отношение симметричной ассоциации
2.3. Группировки понятий и отношений в ЛО
2.4. Лингвистические онтологии, созданные на основе описанной

модели . / •’
Заключение к главе 2 Глава 3. Лингвистическая онтология как средство моделирования структуры связного текста
3.1. Моделирование структуры связного текста
3.1.1. Тематическая структура и тематическая связность текста
3.1.2. Когезия как структурная связность текста
3.2. Моделирование лексической связности на основе тезаурусов
3.3. Автоматическое аннотирование
3.4. Проблемы автоматического построения лексических цепочек
3.4.1. Субъективность выделения лексических цепочек
3.4.2. Построение лексических цепочек с учетом ситуативных

отношении >
3.5. Модель тематического представления текста
3.5.1. Лексические цепочки и тематическая структура текста
3.5.2. Примеры разбора лексических цепочек с учетом тематической структуры текста
3.5.3. Автоматическое построение тематического представления
3.5.4. Сопоставление метода построения тематического представления текстов и вероятностных тематических моделей
Заключение к главе 3 Глава 4. Автоматическая обработка текстов на основе лингвистической онтологии и приложения информационного поиска
4.1. Этапы обработки текстов на'основе ЛО

4.2. Автоматическое разрешение многозначности
4.2.1. Метод глобального подтверждения разрешения лексической многозначности
4.2.2. Метод взвешивания подтверждения от локального и глобального контекстов
4.2.3. Организация тестирования алгоритмов разрешения многозначности
4.3. Информационный поиск на базе ЛО
4.3.1. Концептуальный индекс, веса понятий и отношений
4.3.2. Тестирование эффективности информационного поиска на основе ЛО
4.3.3. Лингвистическая онтология и векторная модель в задаче поиска по коллекции нормативно-правовых актов РОМИП
4.3.4. Использование комбинированных моделей для поиска документов по запросам типа «формулировка проблемы»
4.4. Лингвистическая онтология как ресурс для автоматической рубрикации текстов

4.4.1. Технология автоматического рубрицирования на основе ЛО
'р.« • .
4.4.2. Описание смысла рубрики понятиями ЛО
4.4.3. Автоматическое рубрицирование на основе тематического представления
4.4.4. Эксперимент по автоматической рубрикации текстов в рамках семинара РОМИП 2
4.5. Методы автоматического аннотирования текстов на основе лингвистической онтологии
4.5.1. Метод автоматического аннотирования отдельного текста на основе тематического представления
4.5.2. Построение структурной тематической аннотации текста
4.5.3. Построение аннотации для новостного кластера на
основе тематическрго представления текстов кластера
. з ч '

Для решения задачи разрешения лексической многозначности, вводится понятие наименьшего общего вышестоящего (LCS = Least Common Subsumer). Алгоритм базируется на идее, что нужно выбирать такое значение многозначного слова, наименьшее общее вышестоящее которого наиболее информативно.
Sim т (Ci, С2) = IC(LCS (Сі, С2)) (1.7)
Авторы работы [87] развивают формулу (1.7) следующим образом:
Sim jc (Ci, C2j = 21C(LCS(C,,C2))-
(IC(Ci)+IC(C2)l (1.8)
т.е. учитывается не только коэффициент информационного содержания пересечения путей от синсетов, то и исходное местоположение самих исходных синсетов.
Подчеркнем, что для вычисления информационного содержания, а, значит, и применения описанных выше подходов необходимо иметь семантически размеченный корпус.
В работе [161] описывается тестирование ряда предложенных на базе WordNet метрик на материалах конференции Senseval-2. Для 1723 многозначных существительных коллекции метрики применялись в контексте длиной одно слово. Например, для выражения Plant with flowers, по этим мерам вычислялось сходство существительных plant и flower. Лучший результат был получен для метрики, предложенной в работе [87], и составил 39% точности.
В работе [213] предлагается алгоритм разрешения лексической многозначности на основе разметки предметных областей Wordnet [123], при которой большинство синсетов тезауруса Wordnet отнесены к той или иной предметной области, а если подходящей предметной области нет, то к специальной области Factotum.
Выбор значения многозначного слова основывается на проверке соответствия предметных областей этих значений и слов в локальном

Рекомендуемые диссертации данного раздела

Время генерации: 0.210, запросов: 967