Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка

Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка

Автор: Шаронова, Наталья Валерьевна

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 1984

Место защиты: Харьков

Количество страниц: 226 c. ил

Артикул: 4031727

Автор: Шаронова, Наталья Валерьевна

Стоимость: 250 руб.

Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка  Математические модели суффиксального словообразования и их использование для автоматической обработки отглагольных имен существительных в текстах русского языка 

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1. СОСТОЯНИЕ ВОПРОСА И ПОСТАНОВКА ЗАДАЧ ИССЛЕДОВАНИЯ
1.1. Обзор работ в области автоматической обработки русского словообразования
1.2. Обзор исследований в области моделирования смысла деривата.
1.3. Анализ состояния исследований в области морфемного
и словообразовательного анализа .
1.4. Анализ литературных данных по моделированию механизмов словообразования . .
1.5. Постановка задач исследования.
2. АНАЛИТИЧЕСКОЕ ОПИСАНИЕ СТРУКТУРЫ СУФФИКСА
2.1. Сегментация суффиксальных морфов, классификация сегментов
2.2. Представление суффиксов всех частей речи в сегментированной форме .
2.3. Моделирование линейной сочетаемости сегментов .
2.4. Распределение сегментированных суффиксов в регистре
3. РАЗРАБОТКА СИСТЕМЫ ПРИЗНАКОВ ДЛЯ МОДЕЛИРОВАНИЯ СЛОВООБРАЗОВАНИЯ
3.1. Формирование признаков для моделирования связей суффиксальной морфемы
3.2. Описание семантических признаков модели морфемы
и отношений на их множестве.
3.3. Определение семантических ролей морфем с использованием дерева семантических признаков
3.4. Формирование признаков для моделирования внутриморфемных связей
3.5. Формализация распределения морфов в морфеме
Выводы.
4. ПОСТРОЕНИЕ МАТЕМАТИЧЕСКОЙ МОДЕЛИ СВЯЗЕЙ СУФФИКСАЛЬНОЙ МОРФЕМЫ
4.1. Описание категориальных и лексических значений морфем
4.2. Моделирование связей суффиксальных морфем, обозначающих конкретные имена существительные мужского рода . .
4.3. Моделирование связей морфем, обозначающих конкретные существительные немужского рода и рРтоа i.i. . .
4.4.Построение моделей морфем существительных с абстрактным значением
Выводы.
5. ПРАКТИЧЕСКИЕ ПРИЛОЖЕНИЯ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ
5.1. Разработка и исследование алгоритмов разбиения слова
на морфы
5.2. Эвристический алгоритм решения уравнений алгебры конечных предикатов
5.3. Решение задач словообразовательного анализа и
синтеза на базе решения уравнений АКП .
5.4. Обнаружение и исправление ошибок в суффиксальной
части слова.
5.5. Использование модели словообразования имен существительных в общей системе автоматической обработки текстов . .
Выводы.
Основные выводы.V
ЛИТЕРАТУРА


Словообразование занимается лишь такими семантическими отношениями слов, которые выражены формально внутрисловными средствами. Учитывая вышеприведенные соображения, хотелось бы рассматривать словообразование как часть вообще редукционных способов. Опыт создания толковых словарей типа словаря Огдена и Ричардса показывает, что возможно истолковать весь словарь с помощью базиса, составляющего 0, словаря. Другой, не менее важной задачей может быть определение значения слова по значению его составляющих. Можно не хранить слово в словаре, а находить его по составляющим. Можно также решать задачу понимания неизвестных системе слов, анализируя их морфемный состав. Эти и многие другие задачи требуют для своего решения тщательного формального описания закономерностей русского словообразования, разработки словообразовательных категорий (признаков), в терминах которых можно проводить математическое описание, разработки соответствующей словарной базы, позволяющей обрабатывать информацию о морфемах и их значениях. Общеизвестно, что ключевая проблема в области моделирования естественного языка и использования его в машинных системах -это разработка методов, которые позволили бы машине "понимать" смысл текста. Эта задача очень трудна потому, что смысл текста не является простым объединением смыслов, которые можно извлечь из отдельных частей текста, поскольку, в частности, между предложениями, отстоящими в тексте неопределенно далеко, могут существовать связи, меняющие их изолированный смысл. Основные трудности, возникающие при машинном анализе смысла отдельной фразы, в значительной степени состоят в том, что вместе со словами программе нужно сообщать огромное количество информации об их значении. Вопросы учета взаимовлияния различных частей предложения остаются, но в облегченной форме - контекст имеет определенную длину. Трудность состоит не только в тщательном формальном описании значения слов, но и в умении обрабатывать эту информацию. Таким образом, мы спустились к уровню понимания отдельных слов. Здесь естественен вопрос: можно ли понимать отдельные слова, анализируя смысл составляющих его морфем и вообще следует ли это делать? Решению этого вопроса в традиционном языкознании посвящено немало работ, наиболее подходящими для нужд вычислительной лингвистики следует назвать работы /,/. Однако в самой вычислительной лингвистике имеются существенные аргументы как за, так и цротив того, чтобы заглубляться ниже уровня слова. Все перечисленные аргументы верны лишь в ограниченной степени. По поводу первого аргумента можно возразить, что машинную память можно использовать таким образом, чтобы хранить не значения слов полным списком, а используя редукционные способы и формальное описание правил вывода, и особенно при анализе словообразования. Вторая часть аргумента, касающаяся ошибок словообразовательного анализа из-за наличия морфологических фразеологизмов, вполне справедлива и выход здесь состоит в том, что в машинных системах нужно решительно пересмотреть и сузить словообразовательный анализ по сравнению с тем объемом, в котором этот анализ проводится в традиционной лингвистике. Мы вернемся к этому вопросу после обсуждения третьего аргумента. По поводу третьего аргумента следует сказать, что наиболее эффективные системы обработки смысла построены сейчас на базе английского языка, где морфологических и словообразовательных средств почти нет. Русский же язык является типичным флективным языком с богатыми морфологическими и словообразовательными средствами (табл. Вернемся к обсуждению второго аргумента. С лингвистической точки зрения ситуацию в языке можно несколько упрощенно описать следующим образом. В языке имеются слова двух классов: слова, не порожденные механизмом словообразования, а, наоборот, служащие как бы его исходным материалом (такие слова, как дождь, бог, бой, бык) и слова, порожденные механизмом словообразования (дождевик, боец, божественный, бычок). Нас будут интересовать слова второго класса, обычно называемые производными словами или дериватами. Дериваты удобно расклассифицировать по двум признакам: массовости и выводимости.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.263, запросов: 244