Математические основы автоматизированной таджикско-персидской конверсии графических систем письма

Математические основы автоматизированной таджикско-персидской конверсии графических систем письма

Автор: Гращенко, Леонид Александрович

Автор: Гращенко, Леонид Александрович

Шифр специальности: 05.13.18

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Душанбе

Количество страниц: 115 с. ил.

Артикул: 4641902

Стоимость: 250 руб.

Математические основы автоматизированной таджикско-персидской конверсии графических систем письма  Математические основы автоматизированной таджикско-персидской конверсии графических систем письма 

1.1. Систематизация исходных понятий предметной области.
1.2. Анализ содержания, целей и методов межъязыковой
конверсии систем письма.
1.3. Математическая экспликация исходного понятийного базиса
1.4. Анализ особенностей конверсии систем письма применительно к таджикскоперсидской языковой паре.
1.5. Систематизация проблемных вопросов предметной области
1.6. Анализ существующих и перспективных подходов, методов, методик конверсии систем письма применительно к
таджикскоперсидской языковой паре
Выводы по 1 главе.
Глава 2. Исследование словарных множеств таджикскоперсидской языковой пары и их отношений
2.1. Формирование двуязычного таджикскоперсидского словаря.
2.2. Разработка вспомогательных функций для преобразования символьных цепочек.
2.3. Разработка моделей морфологического представления словоформ таджикского и персидского языков.
2.4. Разработка моделей представления и выявления в тексте арабских заимствований таджикского и персидского языков
2.5. Кластерный анализ словарных баз
Выводы по 2 главе.
Глава 3. Моделирование системы таджикскоперсидской конверсии текстов.
3.1. Обобщенная математическая модель процесса таджикскоперсидской конверсии
3.2. Алгоритмический и параметрический синтез модели таджикскоперсидской конверсии графических систем письма
3.3. Информационнологическое и функциональное моделирование автоматизированной системы таджикскоперсидской конверсии текстов
3.4. Описание проблемноориентированного программного комплекса таджикскоперсидской конверсии графических систем письма.
3.5. Научнотехнические предложения но практическому использованию результатов и положений настоящего исследования
Выводы по 3 главе
Заключение.
Библиографический список.
Приложение 1. Описание буквенного алфавита таджикского языка
Приложение 2. Описание буквенного алфавита персидского языка
Приложение 3. Алгоритм генерации двуязычного
таджикскоперсидского словаря.
Приложение 4. Алгоритм А2 оптимизации системы фильтрующих правил. Экранная форма пользовательского интерфейса СПО генерации
двуязычного таджикскоперсидского словаря.
Приложение 5. Экранная форма пользовательского интерфейса СПО
кластерного анализа двуязычного таджикскоперсидского словаря
Приложение 6. Результаты кластерного анализа.
Приложение 7. Копия отзыва на проблемноориентированный программный комплекс таджикскоперсидской конверсии графических систем письма Академикасекретаря Отделения общественных наук
Академии наук Республики Таджикистан
Приложение 8. Копия акта о реализации положений диссертации в учебном процессе РоссийскоТаджикского славянского университета
ВВЕДЕНИЕ


Для интенсификации таких исследований, возможно, потребуется разработать программные средства поддержки научных изысканий 5. До недавнего времени рассматриваемая проблематика разрабатывалась, в основном, методами языкознания, при этом удовлетворительных решений найдено не было. Согласование систем письма производилось за счет разработки стандартов транслитерации таджикских и персидских текстов в промежуточный текст на основе латинской графики 5. Недостатки этого подхода очевидны. Языковая ситуация с письменностями таджикского и персидского языков, в том числе и в исторической ретроспективе, отражена в ряде трудов Мусаев , Асимова Б. С., Исаев М. И., i . Таким образом, для замены диффузной, интуитивно сформулированной и не имеющей полного решения лингвистической задачи на математическую задачу, логически сформулированную и имеющую алгоритмическое решение, целесообразна математическая экспликация указанной проблематики, методология которой дана в работах Пиотровского Р. Г. 2. Для решения поставленной задачи автором применен комплексный подход 5. Решение задачи основано на членении словоформ исходного таджикского текста на цепочки символов, имеющих однозначное отображение на множество цепочек персидских символов. ТЯ. Исключения, возникающие в результате вероятностного морфоанализа, учитываются в отдельном информационном хранилище. Теоретическими основами для реализации описанного подхода явились научные работы в областях вероятностного машинного перевода 3. Р. автоматической транскрипции имен собственных 3. Бондаренко , В. М.М. В качестве альтернативной выступает разработка на основе технологии Xx ii i . Значительный практический опыт обобщен рядом исследователей в области транслитерации личных имен 2. Ермолович Д. И., i М. В., i . Математическая база для практической реализации систем обработки текстов, модели словообразования и морфоанализа для ТЯ и ПЯ отражены в ряде работ ученых Таджикистана 3. Усманов З. Д., Исмаилов М. А., Худойбердыев Х. Лингвистические основы преобразования систем письменности и типизации словарного многообразия таджикскоперсидской языковой пары представлены рядом работ таджикских лингвистов 2. А.Ю. Анализ и систематизация существующих научных знаний в области автоматической межъязыковой конверсии текстов. Исследование закономерностей отображения множества таджикских словоформ в персидские при таджикскоперсидской конверсии текстов Т1ЖТ. Разработка, исследование и обоснование математической модели ТПКТ. Разработка, обоснование и тестирование комплекса эффективных алгоритмов автоматической ТПКТ и их реализация в виде проблемноориентированного программного обеспечения. Проведение вычислительных экспериментов с целью тестирования и верификации разработанных программных средств и разработка научнотехнических предложений по их практическому использованию и дальнейшему совершенствованию. Объектом диссертационного исследования являются системы письма и множество словоформ таджикскоперсидской языковой пары. Предметом исследований выступают методы и средства комплекс алгоритмов, которые необходимо реализовать для обеспечения автоматизированной таджикскоперсидской конверсии систем письма. ТЯ, позволившего получить перечни и статистические распределения для различных морфологических элементов ТЯ. Практическая значимость работы состоит в возможности широкого внедрения созданных средств конверсии в системах документооборота, а также в качестве элемента многозвенных систем машинного перевода. Теоретическая ценность работы состоит в том, что разработанный подход к математическому моделированию и реализации вычислительных алгоритмов в области межъязыковой конверсии текстов эффективно приспосабливаются для решения как обратной задачи персидскотаджикской конверсии текстов, так и аналогичных задач для других языковых пар. Исходя из поставленной цели исследований по разработке инструментария таджикскоперсидской конверсии текстов, определена структура и содержание диссертационной работы. Она содержит введение, три главы, заключение и приложения.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.244, запросов: 244