Математическое моделирование в многоязыковых системах обработки данных на основе автоматов конечных состояний

Математическое моделирование в многоязыковых системах обработки данных на основе автоматов конечных состояний

Автор: Гильмуллин, Ринат Абрекович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2009

Место защиты: Казань

Количество страниц: 261 с. ил.

Артикул: 4633209

Автор: Гильмуллин, Ринат Абрекович

Стоимость: 250 руб.

Математическое моделирование в многоязыковых системах обработки данных на основе автоматов конечных состояний  Математическое моделирование в многоязыковых системах обработки данных на основе автоматов конечных состояний 

Содержание
ВВЕДЕНИЕ
ГЛАВА 1. Аналитический обзор работ в области систем обработки естественноязыковых текстов.
1.1. Математические лингвистические модели
1.1.1. Предыстория формальных систем обработки ЕЯтекстов
1.1.2. Классификация формальных систем.
1.1.3. Аналитический обзор методов в области машинного перевода .
1.1.4. Концептуальноформальные модели морфологии
вывода.
ГЛАВА 2. Двухуровневая лингвистическая модель на основе автоматов конечных состояний.
2.1. Описание программноинструментальной среды РСЮММО
2.1.1. Структура и функции РСЮММО
2.2. Разработка двухуровневых правил.
2.2.1. Связи и вероятные пары
2.2.2. Конструкция двухуровневых правил
2.2.3. Выполнение двухуровневых правил в виде автоматов конечных состояний
2.3. Описание файла фонологических правил для татарского языка
2.3.1. Структура и содержание файла правил.
2.3.2. Моделирование контекстных соответствий лексичеких и поверхностных уровней в файле правил как основы автоматов конечных состяний
2.4. Описание файла лексических компонент
2.4.1. Структура и содержание файла морфотактических правил
2.4.2. Представление морфотактики в виде автоматов конечных состояний
2.5. Файл морфотактических правил для татарского языка
2.5.1. База морфотактических правил для татарского глагола
2.5.2. База морфотактических правил для татарского имени существительного.
2.5.3. Пример работы распознавателя.
ВЫВОДЫ
ГЛАВА 3. Прагматическиориентированная технология создания сис
тем машинного перевода
3.1. Концептуальный прагматичсскиориентированный подход к соз
данию многоязыковых систем обработки ЕЯданных
3.2. Средства формального описания лексической семантики
3.3. Формальная соматическая модель для описания значений аффик
сальных морфем
3.3.1. Отображение значений аффиксальной морфемы ГА в формаль
ной семантитческой модели.
3.3.2. Сопоставительный анализ значений татарских и турецких аффиксальных морфем на основе формальных семантических моделей
3.4. Метод перевода на основе устойчивых схем переводных соотвст
ствий в системе татарскотурецкого машинного перевода.
3.4.1. Алгоритм построения эвристической модели перевода.
3.4.2. Программные модули системы татарскотурецкого машинного
перевода
ВЫВОДЫ.
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА


В связи с этим нами разработаны формальные семантические модели для описания значений аффиксальных морфем в прагматически-ориентированном контексте и создана таблица соответствия семантических моделей для тюркских (татарского и турецкого) языков, описанные в главе 3. Пользователь системы. Язык программирования. Способ реализации. Создаются новый язык или библиотека, которая реализует некоторые функции в существующем языке программирования. В качестве инструментария описания математических лингвистических моделей в диссертационной работе выбрана программная оболочка РС-К1ММО, которая адаптирована под задачи математического моделирования в многоязыковых системах обработки данных и, соответственно, осуществлена модификация используемых средств и разработаны новые библиотеки, используемые в системе машинного перевода родственных языков. Статус системы. Коммерческие или исследовательские. Вместе с тем, результаты, описанные в главе 2, внедрены в состав коммерческих продуктов, таких как УИС «Россия» (НИВЦ МГУ), Ып§уо хЗ, FineReader 4. АВВУУ, г. Москва), имеющих широкое распространение и применение (соответствующие справки см. Приложении 1). Известно также, что не существует универсального формального описания и даже приемлемой формальной модели какого-либо языка для использования в качестве готовой лингвистической основы в системах обработки данных. В связи с этим в работе [] Д. Сулеймановым Д. ЕЯ-уровия или уровней, обеспечивающие разработчиков структурно-функциональной, а также справочной информацией, необходимой при построении систем и информационных технологий обработки естественно-языковых текстов. ЕЯ-текста, с другой стороны, детерминировать контекст и управлять формированием образа генерируемого или распознаваемого ЕЯ-текста. В частности, вычислительная сложность разработки алгоритмов может быть снижена за счет учета специфики языковых данных, уровней детализации и глубины разработки математических лингвистических моделей различных языковых уровней. Предметом исследования в нашей диссертации являются математические лингвистические модели для обработки родственных языков (на примере тюркских языков), которые характеризуются общим набором параметров описания на всех языковых уровнях. Параметры морфологической модели родственных языков, таких как татарский или турецкий, во многом определяют параметры синтактико-семантичсской модели предложения. Как сказано выше в разделе 1. МП) в общем случае являются одними из самых сложных формальных систем, относящихся по классификации Сулейманова к когнитивным моделям. Проблема машинного перевода имеет богатую предысторию, начиная с -х годов. Особенно активными и продуктивными в развитии машинного перевода оказались -е годы, что связано как с высоким уровнем персональных компьютеров, появлением сканеров и программ OCR, так и с распространением Internet/Intranet, обусловивших реальный спрос на машинный перевод. Проблема машинного перевода рассматривается как ключевая в вопросах продвижении высоких технологий и обеспечении конкурентоспособности в глобальном информационном пространстве. Создание такого рода систем требует значительных ресурсов: экспертов предметной области, лингвистов, математиков, программистов, и естественно, эффективных программных средств. Существуют классификации различного рода систем МП [, 1] по самым различным признакам, из которых наиболее важными представляются следующие. Поколение системы МП. Различаются четыре поколения систем МП в зависимости от структуры алгоритма и от типа формального представления предложения, на уровне которого происходит переход от одного языка к другому. В системах первого поколения алгоритм не разделяется на отдельные блоки анализа и синтеза: синтез данного фрагмента предложения протекает одновременно с его анализом в процессе однократного просмотра фразы слева направо. Лингвистическая информация не отделена и принципиально неотделима от алгоритма, т. По указанной причине в системах первого поколения не используется в явном виде никакое формальное лингвистическое представление предложения.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.284, запросов: 244