Разработка инструментальной среды для экспериментов с алгоритмами поверхностно-синтаксического анализа

Разработка инструментальной среды для экспериментов с алгоритмами поверхностно-синтаксического анализа

Автор: Баталина, Анна Михайловна

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Москва

Количество страниц: 134 с. ил.

Артикул: 4077326

Автор: Баталина, Анна Михайловна

Стоимость: 250 руб.

Разработка инструментальной среды для экспериментов с алгоритмами поверхностно-синтаксического анализа  Разработка инструментальной среды для экспериментов с алгоритмами поверхностно-синтаксического анализа 

содержание
3. ПРОЕКТ НО ОБЪЕКТНОМУ МОДЕЛИРОВАНИЮ В ЛИНГВИСТИКЕ
3.1. Модель лексики языка, основанная на синтезе линг вистических единиц
3.2. МОДЕЛЬ для морфологического анализа
4. ОБЪЕКТНАЯ МОДЕЛЬ ПОВЕРХНОСТНОСИНТАКСИЧЕСКОГО .АНАЛИЗА
4. Объектная модель алгоритмов
4.2 Объектная модель анализируемого предложения
4.3 Объектная модель вычисления алгоритма
4.3.1 Вычислительная среда анализа предложения в рамках одной альтернативы
4.3.2 Вычислительная среда сессии
5. ОПИСАНИЕ ВХОДНЫХ ЯЗЫКОВ ДЛЯ ИНСТРУМЕНТАЛЬНОЙ СРЕДЫ
5.1 Язык графического конструктора ОБЪЕКТОВ
5.2 Язык, основанный на синтаксисе Лиспа
6. ОТЛАДКА АЛГОРИТМОВ ПОВЕРХНОСТНОСИН ГАКСИЧЕСКОГО АНАЛИЗА
6.1 Процесс отладки
6.2 Организация процесса отладки
6.3 Просмотр результатов рабо ты
6. 3.1 Дерево прохода алгоритма
6.3.2 Графическое отображение связей, сегментов и характеристик лексических единиц примера
7. РЕАЛИЗАЦИЯ ИНСТРУМЕНТАЛЬНОЙ СРЕДЫ
7.1 Выбор средств реализации
7.2 ОЫЦЕП ОПИСАНИЕ РЕАЛИЗАЦИИ НА ОСНОВЕ ОБЪЕКТНОЙ МОДЕЛИ
7.2.1 О реализации классов объектов модели
7.2.2 Реализация процесса вы числения
7.2.3 Реализация модуля отладочных функций
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Ее подход отличаетсЯ'ОТ подхода большинства из указанных выше коллективов тем, что синтаксический анализ рассматривается ею не в неразрывной связи с семантическим анализом («когда мы ведем речь о синтаксическом или о семантическом анализе и синтезе текстов, то надо иметь в виду, что это всегда бывает их семантико-синтаксический анализ и синтез» [, разд. Неоднократные попытки программно реализовать разработанные Т. Ю.Кобзаревой алгоритмысинтаксического анализа русского текста не были завершены (хотя частичные программные реализации дают основание. Стоящую перед ними задачу). Помимо несовершенства доступных технических средств (первые попытки производились еще на ЭВМ ЕС) и потери квалифицированных исполнителей, связанной ^ событиями -х гг. Сколь бы глубоко и тщательно ни разрабатывался синтаксический анализатор <. Многие лингвистические факты, в том числе критически: существенные для работы анализатора, никогда не попадали в поле зрения ученых просто потому, что они не имели возможности в массовом порядке: оперировать материалом неверного или неожиданного синтаксического разбора предложений. Именно такой материал в изобилии поставляет развитая система автоматической обработки текстов, а работа с этим материалом позволяет выявить лакуны научного описания и устранить их» [, с. Этому соответствует итеративный процесс пробной программной реализации - оценки пробного решения и анализа его ошибок (как программных, так и алгоритмических) - исправления их в следующей. Здесь можно выделить два подхода: условно говоря, «словарный», использующий богатую лексическую информацию и относительно простые алгоритмические решения (примером может служить система ЭТАП), и «алгоритмический» - использующий минимально необходимую словарную информацию и достаточно сложные алгоритмы (под словом «алгоритм» понимается совокупность. У каждого из них есть свои достоинства и недостатки. Когда объем информации, на основе которой строятся алгоритмы, становится большим, специалисту предметной области (особенно при втором подходе) становится все труднее отслеживать ее актуальность,, корректность с лингвистической точки зрения, проводить умозрительно какие-либо эксперименты с работой алгоритмов на различных примерах. Основная идея предлагаемой работы состоит в том, что оптимальным способом осуществления этого итеративного процесса является разработка“ специальной инструментальной программной среды, которая позволила бы сделать постоянное изменение реализуемой системы программ регулярным процессом. Таким образом, актуальным становится создание специального инструментального средства для наглядного, предметно ориентированного представления лингвистической информации об анализе текста, предоставляющего возможность отладки и лингвистического эксперимента специалисту, реализующему систему лингвистических правил. Представляемая работа описывает такую систему. М.Е. Епифановым, им же разработана объектная модель, положенная в основу описываемой инструментальной среды, реализация которой была выполнена автором данной диссертационной работы. В работе рассматривается инструментальная среда, реализованная для предметно ориентированного моделирования лингвистических алг оритмов и произведения с ними различной сложности вычислительных экспериментов (от изменения порядка их применения до детальной отладки каждого из входящих в них правил). Предметной базой для реализации описываемой среды стали алгоритмы поверхностно-синтаксического анализа (ПСА) Т. Ю.Кобзаревой [-]. Основным методом исследования проблемы реализации инструментальной среды для экспериментов с алгоритмами ПСА являлось применение принципа максимальной предметной ориентированности представления алгоритмов, обеспечения их отладки и вычислительного эксперимента с ними в условиях, приближенных к отладке программ в современных средах программирования. Был проведен анализ «топологии» алгоритмов ПСА с точки зрения переходов от одного узла к другому. Были выявлены основные типы конструкций, используемых в записи правил, для чего реализована специальная БД (подробнее см. Приложение 4). Проблемы обозримости, поддержки, пополнения и отладки совокупности лингвистических знаний при создании систем анализа текста на сегодняшний момент в различных системах решается по-разному. Средства для отладки лингвистических алгоритмов анализа текста в печати не представлены.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.207, запросов: 228