Методы пространственного представления и анализа текстовых описаний для информационно-поисковых систем

Методы пространственного представления и анализа текстовых описаний для информационно-поисковых систем

Автор: Бруттан, Юлия Викторовна

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Псков

Количество страниц: 215 с. ил.

Артикул: 4249729

Автор: Бруттан, Юлия Викторовна

Стоимость: 250 руб.

Методы пространственного представления и анализа текстовых описаний для информационно-поисковых систем  Методы пространственного представления и анализа текстовых описаний для информационно-поисковых систем 

Введение.
1 Исследование вопроса представления текстовых описаний с сохранением семантики для его использовании в информационнопоисковых системах
1.1 Исследование вариантов построения современных информационнопоисковых систем
1.2 Обзор языковых средств концептуального уровня, используемых
в информационнопоисковых системах.
1.3 Исследование задач и проблем, которые возникают при реализации семантической компоненты современных информационнопоисковых систем
1.4 Исследование возможностей существующих вариантов формализованного представления естественного языка для моделирования смысла текстовых описаний.
1.5 Выводы по главе.
2 Разработка метода пространственного представления текстовых описаний на основе нового варианта клеточного автомата
2.1 Формализованное представление текстовых записей в возможной степени сохраняющее семантику текста на естественном языке.
2.2 Разработка нового варианта клеточного автомата на основе использования языка предикатов
2.3 Описание метода пространственного представления текстовых описаний на основе нового варианта клеточного автомата
2.4 Практическое применение метода пространственного представления текстовых описаний
2.5 Выводы по главе
3 Разработка метода распознавания семантического образа текстового описания
3.1 Разработка подхода к распознаванию семантического образа текстового описания
3.2 Пример распознавания семантического образа лингвистически заданного объекта, принадлежащего некоторой предметной
области
3.3 Практическое применение метода распознавания семантического образа текстового описания
3.4 Выводы по главе
4 Проект ирование информационнопоисковой системы, идентифицирующей текстовые описания, используя метод пространственного представления текстовых описаний на основе нового варианта клеточного автомата и метод распознавания семантического образа текстового описания
4.1 Определение требований к информационнопоисковой системе, которая выполняет смысловой поиск текстовых описаний из заданного набора.
4.2 Разработка когнитивной модели информационнопоисковой системы нового типа.
4.3 Основные этапы построения информационнопоисковой
системы на основе разработанной модели.
4.4 Разработка алгоритмов функционирования информационнопоисковой системы.
4.5 Выводы по главе
Заключение
Библиографический список
Приложения
Перечень условных сокращений
БД база данных
БЗ база знаний
ЕЯ естественный язык
ДИПС документальные информационнопоисковые системы
ИМ информационный массив
ИПС информационнопоисковая система
ИЯ информационный язык
КА клеточный автомат
КЗ контекстнозависимый
ЛО лингвистическое описание
ПОЯ проблемноориентированный язык
ТО текстовое описание
ФИПС фактографические информационнопоисковые системы ФЯ формальный язык ЯП язык предикатов
Введение
Представляемая работа посвящена разработке и исследованию методов и средств пространственного представления и сравнения текстовых описаний для их использования в информационнопоисковых системах ИПС.
Актуальность


Заметим, что это единственный тин систем, где в течение многих лет производилась массовая обработка текстовой информации, накапливался огромный по объему набор текстов, имелись возможности широко экспериментировать с семантикой текстов, продвигаясь при этом от простого к сложному. В ИПС методы представления и анализа смысла текстов с самого начала находились в центре внимания. Элементарная теоретикомножественная модель. Текст представлен неупорядоченным множеством лексических единиц. Смысловое соответствие текстов запроса и документа моделируются отношением включения множеств. Текстуальные отношения отсутствуют. Линейные модели. Текст представлен линейно упорядоченным множеством лексических единиц и естественных разделителей. Л предшествует В, расстояние между словами число слов в тексте, разделяющих А и В, а также позволяет фиксировать факт совместного вхождения нескольких слов в один и гот же отрезок текста предложение, алгоритмически различимые части предложения, абзац и т. Формулировка критериев смыслового соответствия допускает здесь определнное разнообразие. При этом могут использоваться либо жсткие, либо гибкие критерии. Синтаксические модели. Текст представлен множеством предложений, каждое из которых изображается деревом синтаксических зависимостей. В рамках синтаксических моделей можно предложить много разных критериев смыслового соответствия. Однако без опоры на семантику они будут в той или иной степени произвольными. Из элементарных критериев наиболее естественными представляются два а дерево запроса целиком входит в дерево, представляющее любое из предложений документа б слова, находящиеся в запросе в отношении непосредственного синтаксического подчинения хозяин слуга , должны находиться в том же отношении и в документе условие соответствия парных связей . Семантические модели. Семантические модели по форме представления текста могут быть подобны синтаксическим дерево зависимостей либо граф более общего вида, но должны фиксировать собственно смысловые отношения между словами. Общий подход к построению правил смыслового соответствия в языках такого типа демонстрируется в логических исчислениях , , . Перечисленные в модели с разной степенью точности способны передавать смысл исходного текста на ЕЯ. Их можно считать последовательными уровнями приближения к смыслу текста. А поскольку предполагается, что все они могут, в принципе, оперировать одним и тем же словарм , то различие их в этом плане сводится к различной точности в передаче смысловых связей между словами текста. Кроме того, названные модели должны различаться и уровнем учта употреблнного контекста. В теоретикомножественной модели эти связи вообще отсутствуют. То же можно сказать и о порядке следования слов. Синтаксические модели занимают промежуточное положение смысловые связи в них отражены, но не однозначно и не полностью. С одной стороны, синтаксическая связь неоднозначна даже полное тождество ее грамматической формы не гарантирует тождества содержания. Вс это делает синтаксические модели не слишком пригодными для целей формального представления смысла . Семантические модели 3, , , должны обеспечивать вполне адекватную передачу смысла. В этих моделях синонимия и омонимия атомарных единиц считаются принципиально недопустимыми, а правила построения выражений и правила вывода должны быть точно определены. Именно в этом и заключается основное отличие семантических моделей от синтаксических . С алгоритмической точки зрения теоретикомножественная модель тривиальна, а линейная модель достаточно проста. Машинный поиск в терминах этих двух моделей может быть реализован достаточно эффективно , . Синтаксические модели , разрабатываются уже в течение нескольких десятилетий, методы синтаксического анализа теоретически и алгоритмически достаточно хорошо проработаны. Алгоритмически синтаксические модели много сложнее линейных, как в плане реализации критериев смыслового соответствия, так и в плане перевода с ЕЯ на язык модельного представления. С алгоритмической точки зрения семантические модели из всех вариантов являются самыми трудно реализуемыми, поэтому и в настоящее время они даже теоретически проработаны явно недостаточно .

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.222, запросов: 228