Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров

Метод формального описания содержания сложных естественно-языковых текстов и его применение к проектированию лингвистических процессоров

Автор: Фомичев, Владимир Александрович

Количество страниц: 230 с. ил. Прил. (с.231-392: ил.)

Артикул: 3309436

Автор: Фомичев, Владимир Александрович

Шифр специальности: 05.13.11

Научная степень: Докторская

Год защиты: 2005

Место защиты: Москва

Стоимость: 250 руб.

Введение
Глава 1. Разработка и исследование математической модели для описания системы первичных единиц концептуального уровня, используемых лингвистическим процессором
1.1. Формализация семантики естественного языка и потребности проектирования лингвистических процессоров
1.2. Постановка задачи
1.3 .Базовые обозначения и вспомогательные определения
1.4. Краткая характеристика предлагаемой математической модели для описания системы первичных единиц концептуального уровня, используемых лингвистическим процессором
1.5.Сортовые системы
1.5.1. Основные идеи определения класса сортовых систем
1.5.2. Формальное определение сортовой системы
1.6. Типы, порождаемые сортовыми системами, и конкретизации типов
1.6.1. Определение множества типов
1.6.2. Интерпретация определения множества типов
1.6.3. Отношение конкретизации на множестве типов
1.7. Концептуальнообъектные системы
1.8. Системы кванторов и логических связок. Концептуальные базисы
1.9. Обсуждение разработанной математической модели для описания системы первичных единиц концептуального уровня,
используемых лингвистическим процессором
1.9.1 .Особенности модели с математической точки зрения
1.9.2. Сравнение модели с другими подходами к описанию
первичных единиц концегггуального уровня
1 Выводы по материалам главы 1
Глава 2. Разработка и исследование математической модели для описания струкгурированных значений предложений и связных текстов на естественном языке
2.1. Постановка задачи
2.2. Краткая характеристика предлагаемого решения поставленной задачи
2.2.1. Краткая характеристика новых правил построения формул
2.2.2. Схема определения трех классов формул, порождаемых концептуальными базисами
2.3. Использование интенсиональных кванторов в формулах
2.4. Использование реляционных символов и разметка формул
2.4.1. Правила для применения реляционных символов
2.4.2. Правило, позволяющее помечать формулы
2.5. Использование логических связок не, и, или
2.6. Построение составных обозначений понятий и объектов
2.6.1. Правило для построения составных обозначений понятий
2.6.2. Построение составных обозначений объектов
2.7. Использование в формулах кванторов существования и всеобщности.
Построение обозначений упорядоченных наборов
2.7.1. Применение кванторов существования и всеобщности
2.7.2. Построение обозначений упорядоченных наборов
2.7.3.Сводная таблица правил Р0Р
2.8. Стандартные Кязыки. Математическое исследование их свойств
2.9. Исследование выразительных возможностей стандартных Кязыков
2.9.1. Удобный способ описания событий
2.9.2. Формализация предположений о структуре
семантических представлений множеств
2.9.3. Построение семантических представлений вопросов
с ролевыми вопросительными словами
2.9.4. Семантические представления вопросов о количестве предметов
2.9.5. Семантические представления вопросов о количестве событий
2.9.6. Семантические представления вопросов с формами вопросительноотносительного местоимения какой
2.9.7. Построение семантических представлений вопросов общеудостоверительного актуальносинтаксического тина
2.9.8. Отображение смысловой структуры команд
2.9.9. Представление теоретикомножественных отношений
и операций на множествах
2.9 . Представление смысла фраз с придаточными предложениями
цели и с косвенной речыо
2.9 Явное представление причинноследственных отношений, передаваемых дискурсами
2.9 Построение семаггических представлений дискурсов со ссылками
на смысл фраз и более крупных частей текста
2.9 Представление фрагментов знаний о мире
2.9 Объектноориентированные представления фрагментов знаний
2 Сравнение выразительных возможностей СКязыков
с возможностями основных известных подходов к формальному представлению содержания ЕЯтекстов
2 Обсуждение построенной математической модели
2 Выводы по материалам главы 2
Глава 3. Анализ возможностей применения аппарата СКязыков к решению ряда актуальных проблем информатики
3.1. Аппарат СКязыков как инструмент проектирования лингвистических процессоров систем автоматизированного контроля смысловой полноты
и целостности документации сложных технических систем
3.2. Разработка семантического сетевого языка нового поколения
3.3. Новые возможности для разработки языков представления
знаний и построения онтологий предметных областей
3.3.1. Онтологии и их значение для глобальных информационных сетей
3.3.2. Анализ возможностей представления знаний о предметных
областях средствами СКязыков
3.3.3. Разработка новых языков представления знаний для решения информационносложных задач
3.4. Возможности использования СКязыков в проектировании интеллектуальных информационнопоисковых и вопросоответных Интернетсистем нового поколения
3.4.1. Актуальность разработки вопросоответных Интернетсистем
3.4.2. Электронные библиотеки и проблема обеспечения доступа общественности к государственным информационным ресурсам
3.5. Определение класса стандартных Кязыков как формальная мсгаграмматика для описания содержания посланий
компьютерных интеллектуальных агентов
3.6. Анализ возможностей использования СКязыков для формирования контрактов и протоколов переговоров в области
электронной коммерции
3.7. Выводы по материалам главы 3 3 Глава 4. Разработка математической модели лингвистической базы данных и нового метода преобразования ЕЯтсксг Семантическое представление
4.1. Постановка задачи
4.2. Формализация дополнительных требований к языку построения семантических представлений текстов
4.3. Текстообразующие системы
4.3.1. Морфологические базисы
4.3.2. Морфологические базисы Ртипа русскоязычного типа
4.3.3. Понятие текстообразующей системы
4.4. Понятие лексикосемантического словаря
4.5. Словари глагольнопредложных семантикосинтаксических фреймов
4.6. Формализация необходимых условий реализации данного смыслового отношения в сочетаниях вида Глагольная форма
Зависимая группа слов
4.7. Словари предложных семантикосинтаксических фреймов
4.8. Лингвистические базисы
4.9. Структуры данных, ассоциированные с текстом в рамках
заданного лингвистического базиса
4.9.1. Компонентноморфологическое представление текста
4.9.2. Проекции компонентов лингвистического базиса на входной текст
4 Матричное семантикосинтаксическое представление ЕЯ текста
4 Новый метод преобразования ЕЯтекстов в их семантические представления
. Принципы установления соответствия между матричным семантикосинтаксическим представлением текста и его Кпредставлением
. Формулировка метода
. Принципы выбора формы семантического представления для текстов различных видов
. Обсуждение разработанного метода преобразования ЕЯтекстов в семантические представления
4 Выводы но материалам главы
Глава 5. Разработка алгоритма семантикосинтаксического анализа текстов из подъязыков естественного языка
5.1. Постановка задачи разработки алгоритма семантикосинтаксического анализа текстов
5.2. Формализация исходных предположений о рассматриваемых подъязыках естественного русского языка
5.3. Начальные этапы разработки алгоритма построения матричного семантикосинтаксического представления входного текста лингвистического процессора
5.4. Описание алгоритма выявления вида входного текста
5.5. Принципы обработки ролевых вопросительных словосочетаний
5.6. Принципы и методы обработки причастных оборотов и придаточных определительных предложений
5.7. Разработка алгоритма поиска возможных смысловых связей между значением глагольной формы и значением зависящей от нее группы слов
5.8. Обработка прилагательных, предлогов, количественных числительных и существительных
5.9. Завершение разработки алгоритма построения матричного семантикосинтаксического представления входного текста
5 Начальный шаг построения семаггических представлений
входных текстов
5 Построение семантических представлений коротких фрагментов входного текста с помощью алгоритма Начал опострСемП
5 Заключительные этапы разработки алгоритма сборки семантического представления входного текста по его матричному семантикосинтаксическому представлению
5 Алгоритм семантикосинтаксического анализа текстов на естественном русском языке
. Описание алгоритма БетЗуп Семантикосинтаксича нал изтекста
. Обсуждение разработанного алгоритма семантикосинтаксического анализа текстов
5 Применение разработанного алгоритма к проектированию русскоязычных интерфейсов прикладных компьютерных систем
. Применения в научнотехнических исследованиях.
. Компьютерные программы, разработанные в рамках учебного процесса
5 Выводы по материалам главы
Заключение по диссертации
Литература


Однако наиболее популярные в е годы формализмы, использовавшиеся для изучения семантики ЕЯ, не предоставляли такой существенной возможности. Представляется, перечисленные ограничения являются наиболее важными с точки зрения проектирования семантикосинтаксических анализаторов дискурсов, относящихся к науке, технике, экономике, медицине, а также для разработки ЕЯинтерфейсов больших баз данных и знаний. Совокупность задач, поставленных перед теорией ЛП в начале х годов, оказалась чрезвычайно трудной. Как следствие, развитие теории ЛП в е годы сильно замедлилось. Несмотря на реализацию значительного количества проектов конструирования ЛП в разных странах мира, существенного продвижения вперед не удавалось достичь. Главная причина этого замедления заключалась в следующем. В ЕЯ причудливым образом взаимодействуют многочисленные механизмы кодирования и декодирования информации. Поэтому часто для того, чтобы понять даже довольно простые для человека фразы или дискурсы, компьютер должен привлекать знания о закономерностях различных уровней языка морфологическом, синтаксическом, семантическом, а также знания о мире и о конкретной ситуации диалога. Например, для того чтобы узнать, какие из нескольких ранее упомянутых объектов обозначаются местоимением их, может потребоваться проведение умозаключений здравого смысла и логических рассуждений. Аналогичная ситуация имеет место и для задачи восстановления смысловой структуры фраз с пропусками слов эллиптичных фраз в контексте всего дискурса или всего диалога. Поэтому, пытаясь формализовать понимание компьютером даже довольно простых текстов, исследователи быстро убеждались в том, что для решения их частных задач необходимо предварительно иметь теоретические решения, относящиеся к произвольным текстам группы естественных языков например, русского, английского, немецкого, французского. В итоге в е годы в англоязычных публикациях даже возникла метафора узкое горлышко теории, отражающая значительные трудности создания адекватной теории понимания компьютером ЕЯ. Наконец, несколькими группами исследователей из разных стран в том числе и автором данной работы была предложена идея, позволяющая найти выход из охарактеризованной тупиковой ситуации. Суть этой идеи заключается в следующем. Необходимо разработать такие формальные языки для представления знаний о мире и построения семантических представлений СП ЕЯтекстов, чтобы можно было конструировать СП в виде выражений, отражающих многое структурные особенности самих текстов. Другими словами, нужны формальные языки или формальные системы, поскольку множество их правильно построенных выражений образует язык для описания структурированных значений или смысла, содержания ЕЯтекстов, обладающие выразительными возможностями, близкими к возможностям ЕЯ. Тогда можно будет выполнять смысловой анализ текста в два этапа ЕЯтекст Т Нейоопреоеленное СП текста Т Целевое СП текста Т. Эту схему нужно понимать следующим образом. Сначала должно быть построено промежуточное, предварительное СП текста, называемое недоопределенным семантическим представлением НСП рассматриваемого текста. Это выражение в большинстве случаев будет отображать смысл входного текста Т лишь частично, неполно. Например, в НСП текста Т может отсутствовать указание на конкретный объект, соответствующий конкретному вхождению в текст Т местоимения ей или не выбрано конкретное значение слова станция, входящего в Т. Однако НСП текста Т является формальным выражением, в отличие от исходного ЕЯтекста Т. Поэтому на втором этапе обработки Т для снятия той или иной недоопределенноспги можно будет вызвать одну из многочисленных специализированных процедурэкспертов по конкретным вопросам. Такие процедуры можно будет проектировать с примененинем формальных средств представления информации, поколъку базы знаний ЛП состоят из выражений формальных языков представления знаний, а исходное НСП вход процедуры и преобразованное НСП в частности, совпадающее с целевым СП являются формальными выражениями. Впервые эта идея была высказана в работах Фомичев, а, 6 ЕотЦсИоу, , .

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.212, запросов: 244