Программно-информационное обеспечение многоязыковой генерации текстов

Программно-информационное обеспечение многоязыковой генерации текстов

Автор: Болдасов, Михаил Викторович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Москва

Количество страниц: 223 с. ил.

Артикул: 2623292

Автор: Болдасов, Михаил Викторович

Стоимость: 250 руб.

Программно-информационное обеспечение многоязыковой генерации текстов  Программно-информационное обеспечение многоязыковой генерации текстов 

Оглавление
Введение.
1. Основы построения систем ЕЯГ.
1.1. Системы ЕЯГ и лингвистически мотивированный подход
1.2. Подходы к построению систем ЕЯГ.
1.2.1. Входное представление для систем ЕЯГ.
1.2.2. Системы МЯГ
1.2.3. Модульность и конвсйерность схемы генерации систем ЕЯГ.
1.3. Архитектура систем ЕЯГ
1.3.1. Вычислительные методы реализации этапов генерации
1.3.2. Промежуточные представления в процессе генерации.
1.3.3. Этап .макропланирования
1.3.3.1. Определение содержания
1.3.3.2. Структурирование содержания Теория предикативных схем
1.3.3.3. Структурирование содержания Теория риторических структур
1.3.4. Эган микропланирования.
1.3.4.1. Агрегация.
1.3.4.2. Лексикализация
1.3.4.3. Вставка ссылочных конструкций.
1.3.5. Этап языкового оформления
1.3.5.1. Грамматики
1.3.5.2. Грамматики
1.3.5.3. Грамматики СмыслТекст
1.3.5.4. Двунаправленные грамматики
1.3.6. Этап физического представления.
1.4. Нерешенные вопросы в построении систем ЕЯГ и выводы для данной
2. Грамматика русского языка в системе .
2.1. Системнофункциональная теория
2.2. Среда
2.2.1. Системы
2.2.2. Входное представление I
2.2.3. Модуль выбора системы
2.2.4. Модуль Ii.
2.2.5. Морфологический блок.
2.3. Лексикограмматический ресурс русского языка
2.3.1. Реализация в ресурсе русской грамматики согласования.
2.4. Система I.
2.4.1. Входное представление дескриптивной логики. Тx и ЛВох
2.4.2. Жанры текстов инструкций системы I
2.4.3. Реализация стадии языкового оформления
2.4.4. Выводы из опыта участия в проекте I.
3. Среда поддержки разработки и эксплуатации генераторов i и генератор .
3.1. Назначение и состав предлагаемых инструментальных средств.
3.1.1. Обрабатываемые данные.
3.1.1.1. Понятие роли в обрабатываемых данных.
3.1.1.2. Свойства.
3.1.1.3. Описание обрабатываемых данных на языке X
3.1.2. Ресурсы.
3.1.2.1. Ресурс сценария
3.1.2.2. Ресурс планирования
3.1.2.3. Ресурс грамматического оформления
3.1.2.4. Ресурс лексического выбора
3.1.3. Реализация инструментальных средств в системе i.
3.1.3.1. Модуль морфологического оформления, интегрируемый в систему
i.
3.2. Архитектура генераторов в системе i.
3.2.1. Генератор
3.2.2. Модель генерации в системе .
3.2.2.1. Макропланирование
3.2.2.2. Микропланирование. Переход к грамматическому представлению
3.2.2.3. Языковое оформление.
3.2.2.4. Этап морфологического оформления
3.2.3. Особенности предложенной схемы генерации.
3.2.4. Технология создания генераторов в среде i.
3.3. Оценка полученного результата
Заключение
Список Литерату


Понимание архитектуры этой системы постоянно уточняется на основе уже разработанных практических систем и теоретических лингвистических исследований. В общем случае считается, что такая «идеальная» система ЕЯГ должна принимать на входе четыре составляющих: систему знаний, из которой будет конструироваться текст, коммуникативную цель порождаемого текста, модель читателя текста, и контекст повествования [Reiter and Dale ]. Система знаний, это информация о предметной области, обычно представленная одной или несколькими базами данных (БД) или базами знаний (БЗ). Для записи системы знаний должен быть выработан единый формализм. Однако на сегодняшний момент такого формализма выработать пока не удалось. Поэтому содержание и представление системы знаний в реальных системах сильно обусловлены особенностями конкретной решаемой задачи. В система знаний генератора включается в пего как отдельный ресурс или же рассредоточивается в других ресурсах генератора. Коммуникативная цель описывает замысел автора текста, назначение текста в коммуникативной ситуации, в которой он порождается. Построение текста по заданной коммуникативной цели и системе знаний - еще не до конца изученный вопрос. Основные проблемы здесь - отсутствие обшей теории представления знаний, недостаточная изученность целепологания человека и нехватка знаний о мотивации выбора той или иной структуры текста на основе поставленной коммуникативной цели. Модель читателя представляет собой модель пользователя системы генерации, для которого предназначаются тексты, создаваемые системой. Такие знания необходимы системе, чтобы правильно выбрать стиль и развернутость изложения, а также последовательность подачи материала. Дискурс - расширенная последовательность предложений, производимых одним или несколькими людьми с цслыо передачи или обмена информацией. Контекст повествования позволяет системе отслеживать, о чем пользователь уже информирован и какие объекты и качества уже были упомянуты, что может быть использовано, например, как основание для вставки в генерируемый текст ссылочных конструкции, таких как анафорические ссылки. Контекст повествования -динамическая структура для генератора, он изменяется по мере создания генерируемого текста. Одна из наиболее типичных проблем, которые приходится решать в последнее время с помощью систем генерации - это порождение текстов сразу на нескольких языках из единого входного представления. Чрезвычайная актуальность этой задачи выделяют се в отдельное направление генерации - многоязыковую генерацию на ЕЯ (МЯГ) (Соколова, Шаров ). МЯГ - достаточно новая область генерации на ЕЯ. Первая коммерческая система МЯГ, система FOG, появилась только к началу ’ых в Канаде. Она была предназначена для генерации морских сводок погоды на английском и французском языках. Многоязыковая генерация рассматривается как развитие сразу двух областей компьютерной лингвистики: Машинного Перевода (МТ) и ЕЯГ. Наиболее характерная черта МЯГ - это языковая инвариантность (интсрлингвистичность) ее входного представления. Входное представление выбирается таким образом, чтобы оно было минимально зависимо от особенностей какого-то отдельного ЕЯ. Зависимость входного представления от одного из языков генерации может усложнить создание текстов на других языках и вывести генерацию на этих языках из общего русла процесса генерации. Идея использования межъязыкового входного представления для систем генерации заимствована из Машинного Перевода, а именно направления этой области, именуемого intcrlingua based МТ (Nircnburg ). Системы машинного перевода, основанные на технологии interlingua based МТ, в качестве промежуточного информационного носителя в процессе перевода используют межъязыковой код, построенный из языковых инвариантов, то есть структур, существующих во всех ЕЯ. Межъязыковое представление может быть формализовано различными способами. Например, оно может быть выражено в исчислении логики предикатов первого порядка или быть представлено как адаптированный ЕЯ (например, английский). Исследования в области МЯГ внесли значительный вклад в изучение процесса генерации.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.223, запросов: 244