Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения

Иерархизация синтаксического анализа на основе свойств линейной структуры русского предложения

Автор: Кобзарева, Татьяна Юрьевна

Шифр специальности: 10.02.21

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Москва

Количество страниц: 192 с. ил.

Артикул: 4138428

Автор: Кобзарева, Татьяна Юрьевна

Стоимость: 250 руб.

Оглавление
ВВЕДЕНИЕ
Актуальность исследования
Цель работы и задачи исследования
Объект, предмет и материал исследования
Новизна и значимость исследования
Теоретическая значимость исследования
Прикладная значимость исследования
Основные результаты исследования
Практическая ценность работы
Основные используемые понятия
Методы исследования
Апробация
Структура работы
ПЕРВАЯ ГЛАВА. Автоматический синтаксический анализ русского предложения история и современное состояние проблемы
1.1. История постановки задачи
1.2. Теоретические предпосылки создания автоматического синтаксического анализа. Структурный синтаксис.
1.3. Первые работы по синтаксическому анализу русского текста
1.4. Современное состояние проблемы
1.5.Частные проблемы автоматического анализа
1.6. Вероятностные подходы
1.7. Выводы
ВТОРАЯ ГЛАВА. Свойства проективности и рекурсивности и их роль в иерархизации синтаксического анализа
2.1. Введение
2.2. Проективность и рекурсивность подчинительных связей
2.2.1. Понятие проективного фрагмента
2.2.2. Иерархия предикативных ситуаций в сегменте
2.2.3. Место именных и предложных групп в линейной структуре предложения
2.2.4. Особенности линейной организации рекурсивной матрешки именных и предложных групп
2.2.5. Процедура анализа рекурсивных структур. Анализ матрешек именных и предложных групп
2.2.6. Типы линейной конфигурации именных и предложных групп
2.2.7. Некоторые проблемы, возникающие при анализе согласованного определения в препозиции к хозяину
2.2.8. Ограничение зоны поиска хозяина согласованного определения и слуги предлога как фильтр проективности
2.2.9. Выводы по разделу 2.2.
2.3. Рекурсивность и проективность сочинительных связей в русском тексте
2.3.1. Введение
2.3.2. Функциональные особенности структуры сочиненных групп
2.3.2.1. Сочинительное сокращение
.2.2. Обязательная манифестация сочинения в тексте
2.3.2.3. Сочинительное сокращение как фактор недревовидности графа
2.3.2.4. Рекурсивность и проективность сочинительных связей. Зоны влияния сочиненных слов
2.3.2.5. Рекурсивность и иерархия сочинительных
2.3.3. Выводы к разделу 2.3.
ТРЕТЬЯ ГЛАВА. Общие принципы организации системы, иерархия модулей синтаксического анализа и их задачи
3.1 Уровни анализа и соответствующие им модули СА
3.2. Динамическая и статическая компоненты анализа
3.2.1. Верификация лингвистических и алгоритмических решений
3.2.2. Структура словарей и морфологический анализ
3.2.2.1. Словари
3.2.2.2. Морфологический анализ
3.2.3. Синтагмы
3.2.4. Особенности организации процедуры анализа рекурсивных структур
3.3. Задачи модулей
3.3.1. Модуль постморфологического анализа
3.3.1.1. Числительные
3.3.1.2. Названия в кавычках
3.3.1.3. Имена собственные лиц
3.3.2. Модуль разрешения омонимии частей речи
3.3.2.1. Словосочегания
3.3.2.2. Частичная омонимия
3.3.2.3. Словарь типов омонимии частей речи
3.3.3. Модуль предсегментации
3.3.3.1. Именные и предложные группы
3.3.3.1.1. Поиск хозяина имени собственного
3.3.3.1.2. Анализ определительных именных и предложных групп
3.3.4. Модуль сегментации
3.3.5. Модуль внутрисегментного анализа
3.3.6. Межсегментный анализ
3.3.7. Анализ кореференции
ЧШВЕРТАЯ ГЛАВА. Моделирование сегментной структуры русского предложения. Два этапа сегментации.
4.1. Омонимия и синонимия знаков препинания в русском тексте
4.1.1. Знаки препинания и проективность линейной структуры
4.1.2. Омонимия и бифункциональность знаков препинания
4.1.2.1.Запятая
4.1.2.2. Тире
4.1.2.3. Двоеточие
4.1.2.4. Скобки
4.1.2.5. Точка
4.1.3. Омонимия знаков препинания и сегментная омонимия линейной структуры предложения
4.1.3.1. Примеры неоднозначности сегментации при определении значения запятой правой границы
сегмента уь. оператора сочинения
4.1.3.2. Некоторые неоднозначности интерпретации знаков препинания при определении левой границы вложенных сегментов, вытекающей из омонимии знаков препинания
4.1.4. Синонимия знаков препинания
4.2. Грамматика сегментной структуры русского предложения и принципы его сегментации
4.2.1. Сегментация как ключевая компонента системы
4.2.2. Сегмент в линейной структуре предложения
4.2.3. Идеальная модель линейной структуры сегментов в русском предложении
4.2.4. Осложнение линейной структуры предложения вложениями
4.2.5. Операторы и их функции в предложении функции запятых и сочинительных союзов
4.2.6. Бифункциональность занятой и функциональная неоднозначность операторов
4.2.7. Сегментация
4.2.7.1. Объект, задача и организация анализа
4.2.7.2.Две ступени моделирования сегментной
структуры
4.2.7.2.1 Стратегия анализа асегментов
4.2.7.2.2. Процедура формирования асегмента
4.2.8. Свойство проективности линейной структуры сегментов
4.2.9. Семантика сегментной структуры или условия присоединения
4.2.9.1. Условия удлинения деепричастных и причастных оборотов
4.2.9.1.1. Запреты присоединения
4.2.9.1.2. Условия присоединения
4.2.9.1.2.1. Присоединение без опоясывания
4.2.9.1.2.2. Условия присоединения отрезка по сочинению при разрыве
4.2.9.1.2.3. Условия присоединение 3отрезка по управлению при разрыве
4.2.9.2. Построение асегмента придаточного
4.1.9.3. Условия удлинения аотрезка придаточного
4.2.9.4. Анализ сочинения предикатов при
удлинении придаточных
4.2 Построение 3сегментов
4.2 Выводы к разделу 4.2.
4.3. Второй этап сегментации построение графа связей сегментов
4.3.1.Лингвистический базис построения связей сегментов и некоторые проблемы, возникающие при поиске слова хозяина сегмента
4.3.2. Отношения между сегментами
4.3.3. Особенности сегментной структуры предложения, осложняющие поиск межсегментных связей
4.3.3.1. Факторы, осложняющие ответ на вопрос, какое слово является хозяином асегмента
4.3.3.2. Факторы, осложняющие ответ на вопрос, где искать хозяина асегмента
4.3.4. Проективность межсегментных связей
4.3.5. Общие правила проективности межсегментных связей
4.3.6. Поиск хозяина деепричастного оборота
4.3.7. Специфика поиска хозяина ПП
4.3.7.1. Виды ПП
4.3.7.1.1. А
4.3.7.1.2. В
4.3.7.1.2.1. Скрепы
4.3.7.1.2.2.Семантика хозяина ПП
4.4. Выводы к разделу 4.3.
ЗАКЛЮЧЕНИЕ
БИБЛИОГРАФИЯ


Промоделирована иерархия связей внутри сегмента, определяющая линейную организацию сегмента и рекурсивной линейной структуры проективных фрагментов определительных именных и предложных групп ИГ и ПГ, позволяющая иерархизировать задачи моделирования структуры предложения. Разработан рекурсивный алгоритм, строящий проективные фрагменты ИГ и ПГ любой степени сложности. А.А. Зализняка и грамматика и соответствующий модуль разрешения наиболее значимых типов этой омонимии. Описанные свойства линейной структуры русского предложения, разработанные модели и сами модули СА могут быть применены во многих системах автоматической обработки русского текста. Грамматика линейного синтаксиса, модели и алгоритмы являются продуктивной базой дальнейших теоретических и экспериментальных исследований в области СА, позволяющей совершенствовать и сам базис, и программные средства его реализации. Результаты исследования сегментной структуры и функциональных значений знаков препинания могут быть эффективно использованы как объясняющая модель при преподавании русского синтаксиса. Программная реализация системы может служить аппаратом исследования специфики синтаксиса разных авторов и разных функциональных стилей, и, в том числе, для изучения тенденций современных изменений в синтаксисе русского языка. По мере накопления материала она сможет использоваться как инструмент стилистической экспертизы. В настоящее время аспиранткой Отделения интеллектуальных систем в гуманитарной сфере РГГУ А. М. Баталиной и старшим преподавателем этого Отделения М. Е. Епифановым на базе алгоритмов системы создана инструментальная среда для экспериментов с алгоритмами синтаксического анализа, которая позволяет легко корректировать и пополнять алгоритмы. Основные используемые понятия. При обсуждении линейной структуры предложения Б будем использовать следующие понятия. Слова и морфологически автономные группы слов Плунгян , эксплицитно заданные пробелами и функционирующие как слова. Сегменты части предложения с эксплицитно заданными соответственно правилам русской пунктуации границами простые предложения или простые в роли главных простыеглавные, придаточные предложения, деепричастные обороты, всякого рода определительные, вводные и другие обороты, требующие обособления. Проективные фрагменты отрезки предложения, удовлетворяющие условиям проективности Иорданская , которые являются частью сегментов и границами которых служат слова, связанные отношениями подчинения или сочинения Кобзарева , 6. При моделировании структуры Б будем различать три вида связей слов иили сегментов 1. Все связи слов и сегментов получают при анализе номера соответственно номерам синтагм в списке принятой в системе классификации связей см. Список синтагм в Приложении. При этом синтагмы не объединяются в отношения непосредственной доминации, как в Мельчук , Иорданская , т. На каждом из моделируемых уровней, для которого создается отдельный модуль анализа в системе, на основании лингвистических представлений и наблюдений соответствующих явлений строятся одна или несколько идеальных моделей подлежащих анализу синтаксических явлений. Каждая такая модель является обобщением, объединяющим большую часть возможных в русском языке линейнокомбинаторных манифестаций группы синтаксически близких явлений. На каждом этапе анализа предполагается строить только синтаксически истинные варианты интерпретации линейной структуры. На основании этих свойств вводятся универсальные, работающие па всех этапах анализа правила и специфические для каждого уровня правила, которые задают набор возможных структур для рассматриваемых явлений, а также определяют оптимальные процедуры идентификации структур. Группы лингвистических правил объединены в алгоритмы, каждый из которых представляет собой дерево, узлами которого являются описания ситуаций, определяющие синтаксическое значение текстовых манифестаций синтаксически близких явлений, моделируемых данным алгоритмом. Каждый модуль системы включает в себя несколько алгоритмов. Контекстные ситуации в алгоритмах записываются на естественном языке в форме, близкой к обычным грамматическим описаниям, что делает их легко доступными для понимания.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.191, запросов: 138