Методы автоматического поиска релевантной информации в тексте на естественном языке

Методы автоматического поиска релевантной информации в тексте на естественном языке

Автор: Комаров, Игорь Иванович

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2003

Место защиты: Санкт-Петербург

Количество страниц: 115 с. ил.

Артикул: 2617876

Автор: Комаров, Игорь Иванович

Стоимость: 250 руб.

1. Обоснование и выбор метода формализации ЕЯ, допускающего эффективное использование в компьютерных системах.
2. Выбор разработка методов автоматического поиска релевантной информации АПРИ в тексте на ЕЯ ТЕЯ.
3. Доказательство возможности гомоморфных преобразований между формализованным представлением естественного языка и структурой реляционных баз данных.
4. Определение подходов к использованию ЕЯ для решения задач взаимодействия с РБД.
В результате исследования разработан метод автоматического поиска релевантной информации, который может быть использован в КС доказан
гомоморфизм семантических отношений реляционной базы данных и текста на естественном языке.
Структурно работа подразделяется на введение, 3 главы и заключение, сопровождается 6ю приложениями.
Введение


Попытка переложить задачу поиска и обработки текстовой информации на КС сталкивается с рядом трудностей. И основная проблема состоит уже не в способах хранения данных и производительности вычислительных средств. Узкое место задачи автоматической обработки ЕЯинформации в том, что большинство существующих моделей строения и функционирования языка отражают лишь отдельные аспекты задач ЕЯобеспечения ЕЯО КС, а приложения, созданные на основе этих моделей, имеют ограниченное применение и подвержены взрыву сложности разработки. Анализ опыта разработки и эксплуатации информационных систем ЕЯО КС показывает, что вне зависимости от формы автоматического использования ЕЯ информации . Для решения задачи формального определения релевантности информации в ЕЯ массивах требуется разработка методов манипулирования этой информацией как минимум на семантическом уровне. Для чего необходимо использовать адекватную формальную модель строения и функционирования ЕЯ. Следовательно, образуется последовательность взаимообусловленных задач автоматическая обработка ТЕЯ требует наличие формальных методов автоматического поиска релевантной информации, а методы АПРИ должны опираться на формальную модель строения и функционирования ЕЯ. ЛПРИ для решения задач ЕЯО КС, а с другой наличием семантического подхода к формализации ЕЯ, доказавшим свою продуктивность. В . АПРИ является семантическая модель естественного языка, разработанная профессором факультета Прикладной математики Процессов управления д. Тузовым В. Для получения логически завершенного результата исследбвание включает ряд частных задач обзор и обоснованный выбор метода формализованного представления ЕЯ, адекватного задачам ЕЯО КС разработка методов автоматического поиска релевантной информации в ТЕЯ, основывающихся на выбранном методе ФПЕЯ доказательство гомоморфизма между представлением информации в базе данных и ФПЕЯ, что позволяет проводить формальные преобразования информации из одной формы в другую. Для решения частных задач исследования используется математический аппарат теории формальных грамматик, теории множеств и реляционной алгебры. В связи с расположением настоящей работы на стыке гуманитарных и строгих естественнонаучных дисциплин, а также терминологическими расхождениями различных лингвистических школ, термины и понятия, имеющие различные трактовки поясняются при первом упоминании, а в приложении 1 приводятся результаты попытки установления взаимного соответствия некоторых терминов. Особое значение в работе имеют два понятия текст на естественном языке и семантика сообщения. Под ТЕЯ понимается цепочка символов, отвечающая требованиям грамотности школьного уровня . Способ получения этой цепочки значения не имеет будь это текст, набранный на компьютере, отсканированный с твердого носителя или полученный посредством устройства речевого ввода. То, что инвертируется отрицанием высказывания в Лротивоположность пресуппозиции, которая инвариантна операции отрицания. Любое из этих утверждений не может служить критерием выделения семантической составляющей ЕЯ. Так для 1го определения синонимия. Для 2го методы кодирования выбираются как раз, исходя из априорного знания релевантности составляющих сообщения. В 3м операция отрицание, как и в варианте 2, направленная либо неопределенная функция. КС. Этот подход определяет и общую направленность исследований на разработку методов допускающих эффективное практическое использование в КС. Следует сделать особые замечания об источниках информации, использованных в работе. Значительную их часть составляют материалы из сети 1п1егпс1 и работы, являющиеся объектами интеллектуальной собственности. Источники первого рода не допускают прямые ссылки в силу динамичности информации, располагаемой на страницах, а поиск в архивах сайта не всегда приводит к результату. Источники второго рода не имеют широкого распространения. Поэтому некоторые ссылки, приводимые в работе, имеют целью не столько указание на дополнительный источник информации, сколько отделение суждений автора от заимствований.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.263, запросов: 244