Синтаксический анализатор адаптивной системы общения человека с ЭВМ на естественном языке : Пунктуац. компонент

Синтаксический анализатор адаптивной системы общения человека с ЭВМ на естественном языке : Пунктуац. компонент

Автор: Полякова, И. Н.

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 1994

Место защиты: Москва

Количество страниц: 147 с.

Артикул: 170503

Автор: Полякова, И. Н.

Стоимость: 250 руб.

СОДЕРЖАНИЕ
ВВЕДЕНИЕб
ГЛАВА 1. МЕТОДИКА ПОСТРОЕНИЯ ФОРМАЛИЗОВАННОЙ МОДЕЛИ СИСТЕМЫ ПУНКТУАЦИОННЫХ ПРАВИЛ. МОДЕЛЬ
ПУНКТУАЦИИ РУССКОГО ЯЗЫКА
П.1 Определение и назначение пунктуации
П.2 История пунктуации .
П.З Знаки препинания в текстах различной функционально стилевой принадлежности
П.4 Основные понятия описываемой методики .
П.5 Лишние и пропущенные знаки препинания
в анализируемом тексте
П.б Отделяющие и выделяющие пунктуационные правила
П.7 Отделяющие и выделяющие знаки препинания .
П.8 Обязательные, рекомендательные и факультативные правила.
П.9 Роль морфологии, синтаксиса, семантики и интонации при проверке правил рассматриваемой
модели.
П. Важность знания ключевых служебных слов .
П. Локализуемые и нелокализуемые ошибки
П. Дополнительная информация для проверки
некоторых правил рассматриваемой модели .
П. Методика построения формализованной модели
системы пунктуационных правил
П. Общая характеристика английской пунктуации и описание на основе разработанной методики пунктуационной модели английского языка .
П1 Сравнительный анализ пунктуации
английского и русского языков .
П2 Модель пунктуации английского языка .
ГЛАВА 2. ПУНКТУАЦИОННЫЙ КОМПОНЕНТ СИНТАКСИЧЕСКОГО АНАЛИЗАТОРА СПК И ЕГО ПРОГРАШНАЯ РЕАЛИЗАЦИЯ .
П.1 Основные программные модули и их реализация. .
П.2 Процессорная и беспроцессорная реализация
алгоритмов пунктуационного контроля
П.З Режимы работы СПК. Диалоговый режим
П.4 Пакетный режим работы. Степени полномочий . .
П.5 Схема работы пунктуационного компонента .
П.6 Описание работы пунктуационного компонента . .
П.6.1 Общий алгоритм проверки пунктуационных
П.6.2 Дополнительные составляющие лингвистической базы данных, необходимые для работы
основных программных модулей .
П.6.3 Описание основных программных модулей . .
ГЛАВА 3. АДАПТИВНЫЕ ВОЗМОЖНОСТИ СПК.
П. 1 Конфликтные ситуации, при возникновении
которых вызывается блок языковой адаптации .
П. 1.1 Недопустимые знаки препинания
П. 1.2 Допустимые знаки препинания
П.1.3 Авторские знаки препинания .
П.1.2 Изменяемость значений знаков препинания .
П.2 Метазнания, используемые при адаптации
пунктуационного компонента .
П.З Описание блока языковой адаптации .
П.3.1 Модуль, обрабатывающий
допустимые знаки препинания Б0Р .
П.3.2 Модуль, обрабатывающий
недопустимые знаки препинания ЫТ . . . 0 П.3.3 Модуль, обрабатывающий
авторские знаки препинания 0ВРАа
П.3.4 Модуль, контролирующий процесс адаптации
к авторским знакам препинания АБАРТР . . 3 П.3.5 Модуль, осуществляющий выбор
знака препинания Ювги
ГЛАВА 4. ПРИКЛАДНЫЕ СИСТЕМЫ, РАЗРАБОТАННЫЕ
НА ОСНОВЕ СПК.
П.1 Адаптивная система СИПКО, осуществляющая
пунктуационный контроль русскоязычных текстов
П. 2 Система, обучающая пунктуации русского языка . ИЗ
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА


Такое направление развития представляет разрабатываемая на кафедре алгоритмических языков факультета ВМиК МГУ под руководством профессора М. Г.Мальковского система ЛИНАР (литературно-НАучный Редактор) - интеллектуальная система комплексного контроля и редактирования русскоязычных текстов С, в составе которой используется ЛП АДАМАНТ [. ЛП является, как правило, ядром практически любой ЕЯ-системы. Ведь именно он обеспечивает анализ фраз и получение их синтактико-семантического представления. В настоящее время разрабатываются ЛП двух основных типов -интегрального и модульного С. Модульный подход предполагает такое устройство системы, при котором каждому уровню лингвистического анализа соответствует отдельный компонент (модуль) системы: морфологический, синтаксический, семантический. При этом синтаксический уровень представлен в системе в явном виде: он выделен в отдельный блок, преобразующий текст в его синтаксическое представление. Примером системы, проектируемой по модульному принципу, может служить , к примеру, система APT []. Разработка системы производится приблизительно в течение последних пяти лет в ИПМ им М. В.Келдыша и имеет целью построение экспериментального ЛП, выполняющего процедуры анализа текста в модульном варианте. Адаптивный многоцелевой анализатор АДАМАНТ, разрабатываемый на факультете ВМиК МГУ под руководством М. Г.Мальковского [6] и являющийся лингвистическим ядром трех систем - TULIPS-2 [6), ЛИНАР [, СИСФОРМ [3, также представляет модульную систему. АДАМАНТ имеет модули морфологического, синтаксического и семантического анализа, а также блок лингвистических метазнаний, позволяющих ЛП адаптироваться к незнакомым словам и конструкциям, а также выявлять ошибки во входном тексте. Адаптивные возможности вообще являются очень сильной чертой рассматриваемой системы. Характер взаимодействия модулей таков, что анализ конкретной фразы предполагает перемежающееся подключение морфологического, синтаксического и семантического анализаторов. В системе САГА [ ,в силу ориентации на широкую предметную область и разнообразные виды текстов (с самого начала САГА проектировалась как промышленно-ориентированная система для обработки текстов электротехнической тематики и других отраслей машиностроительного комплекса), разработчиками также принят модульный принцип построения системы. Каждый модуль стремится дать достаточно полное описание на соответствующем ему уровне лингвистического анализа. Другая стратегия построения ЛП реализована в системах интегрального анализа с линейно упорядоченной обработкой (то есть одноразовым проходом по тексту) С. Синтаксический и семантический анализаторы (а зачастую и анализатор прагматического уровня) слиты в единый блок. Система ориентируется сразу на формирование на основе текста достаточно богатых концептуальных структур, а не на постепенную "глубинизацию" понимания, как это имеет место в системах модульного типа. В системе интегрального типа не предусматривается формирование синтаксического представления входного текста. Синтаксическая информация используется фрагментарно и лишь как вспомогательная. Одним из основополагающих понятий интегрального анализа являются понятия практической цели и интереса [3. Именно практические цели, преследуемые при обработке текста, направляют использование всего комплекса знаний и позволяют выделить из текста ту информацию, которая представляется наиболее важной. Практические цели задают и ту шкалу, в соответствии с которой часть информации , содержащаяся в тексте, признается более важной, более интересной, а другая часть - менее интересной или несущественной вовсе. Очевидно, что анализатор, воплощающий принцип интереса, не должен затрачивать время на обработку ” неинтересной” части текста. Поэтому идея интегральной обработки тесно связана с понятием переменной глубины анализа. Один из идеологов интегрального подхода - Р. Шенк ([3 с. Чело-век, понимающий тексты на естественном языке, руководствуется тем, что он хочет знать (а также тем, что он не хочет знать). Это позволяет ему не замечать всех неоднозначностей , проблем полисемии, бесчисленных импликаций, и других трудностей.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.214, запросов: 244