Модель принятия решения на основе синтаксического анализа в задачах обработки патентной информации

Модель принятия решения на основе синтаксического анализа в задачах обработки патентной информации

Автор: Буштедт, Владислав Андреевич

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2011

Место защиты: Москва

Количество страниц: 279 с.

Артикул: 5382888

Автор: Буштедт, Владислав Андреевич

Стоимость: 250 руб.

Модель принятия решения на основе синтаксического анализа в задачах обработки патентной информации  Модель принятия решения на основе синтаксического анализа в задачах обработки патентной информации 

Введение
Глава 1. Задача синтаксического анализа в системах принятия решения в сфере патентного поиска.
1.1. Особенности поиска в патентной сфере и компьютерные модели для обработки патентной информации.
1.2. Обработка текстов на естественном языке.
1.2.1. Область обработки естественного языка.
1.2.2. Проблемы, возникающие при обработке естественного языка.
1.2.3. Блочный подход к созданию лингвистических процессоров.
1.2.4. Проблемы, связанные с процессом извлечения знаний из текста.
1.3. Модели синтаксиса.
1.3.1. Грамматики для обработки естественного языка
1.3.2. Теория порождающей грамматики.
1.3.3. Грамматика зависимости
1.3.4. Теория стохастических вероятностных грамматик и сетей.
1.3.5. Функциональные теории.
1.4. Синтаксический анализ.
1.4.1. Общие сведения
1.4.2. Грамматика непосредственно составляющих.
1.4.3. Дерево синтаксического подчинения.
1.4.3.1. Грамматика зависимостей.
1.4.3.1.1. Структура как связи между словами.
1.4.3.1.2. Грамматика зависимостей в современных лингвистических теориях.
1.4.4. Проблемы, возникающие при синтаксическом анализе текстов на естественном языке .
1.4.4.1. Неоднозначность в естественном языке
1.4.4.2. Проблема разрешения синтаксической неоднозначности
1.4.4.3. Неконфигурированность языка.
1.4.4.4. Проективные и непроективные предложения.
1.4.4.5. Ограничения на порядок слов.
1.5. Задачи близкие синтаксическому анализу
1.5.1. Корпус лингвистических структур.
1.5.1.1. Для каких целей полезны трибэнки.
1.5.1.2. Уровни аннотаций трибэнка.
1.5.1.3. Трибэнк для русского языка
1.5.2. Процедура маркировки по частям речи или морфологическая разметка
1.5.2.1. Принцип проведения морфологической разметки.
1.5.2.2. Первый корпус помеченных текстов
1.5.2.3. Использование скрытых моделей Маркова при определении наиболее вероятной части речи для многозначных слов.
1.5.2.4. Применение методов динамического программирования для определения наиболее вероятной части речи для многозначных слов.
1.5.2.5. Наиболее эффективные алгоритмы для определения части речи слова в предложении .
1.5.2.6. Корпуса текстов, пригодных для проведения маркировки но частям речи.
1.6. Алгоритмы, связанные с задачей синтаксического анализа
1.6.1. Алгоритм Леска
1.6.2. Алгоритмы для выявления словоизменений Стимминг.
1.6.3. Алгоритмы для производства синтаксического разбора предложения
1.6.4. Фундаментальный алгоритм анализа зависимости
1.6.4.1. Простые алгоритмы и стратегии синтаксического анализа.
1.6.4.2. Усовершенствование алгоритмов синтаксического анализа.
1.7. Обзор существующих синтаксических анализаторов
1.7.1. Синтаксические анализаторы фраз ЕЯ
1.7.1.1. Стратегия недетерминированного фильтрового анализа
1.7.1.2. Стратегия, основанная на механизме возвратов i.
1.7.1.3. Стратегия детерминированного анализа
1.7.2. Возможности существующих программ для синтаксического анализа предложения.
1.7.3. Синтаксический анализатор x
1.7.4. Синтаксический анализатор i
1.7.5. Системы ЭТАП3 и ПРОМТ
1.7.6. Частичный синтаксический анализатор iiv 2.0.
1.7.7. Синтаксический анализатор vi
1.8. Чанкинг как модель частичного синтаксического анализа.
1.9. Выводы по главе 1.
Глава 2. Теоретические основы патентного поиска с использованием частичного
синтаксического анализа
2.1. Математическая постановка задачи принятия решения в процессе патентного поиска.
2.2. Понятие синтаксического анализа
2.3. Виды предложений в русском языке. Понятие сегмента.
2.4. Вербальное описание алгоритма частичного синтаксического анализа.
2.5. Блочный алгоритм для проведения синтаксического анализа
2.6. Условия проверки сочетаемости слов для построения чайков.
2.7. Описание применения эвристик, направленных на уменьшение количества ложно выявленных чанков.
2.8. Математическая постановка задачи частичного синтаксического анализа чанкинга
2.9. Дерево синтаксического подчинения в контексте чанкинга.
2 Математическая постановка задачи частичного синтаксического анализа чанкинга с ограничениями, возникающими на этапе построения дерева синтаксического подчинения
2 Расширенная нотация для задачи синтаксического анализа.
2 Выводы л.
Глава 3. Программный комплекс для проведения частичного синтаксического анализа и
поддержки принятия решения i
3.1. Программный комплекс i.
3.1.1. Обзор функции нрофаммиого комплекса i
3.1.1.1. Проведение частичного синтаксического анализа с помощью программного комплекса
3.1.1.2. Встроенный модуль для проведения патентного поиска на русском языке.
3.1.1.3. Дополнительные возможности программного комплекса.
3.1.1.3.1. Встроенный морфологический анализатор отдельных слов на русском языке
3.1.1.3.2. Встроенный модуль для проведения статистических исследований анализируемого текста.
3.1.1.3.3. Формирование отчета об обнаруженных чанках в формате x.
3.1.1.3.4. Предварительные выводы
3.1.2. Структура данных в программном комплексе
3.2. Экспериментальное исследование модели частичного синтаксического анализатора.
3.2.1. Описание методики экспериментального исследования модели и эффективности работы алгоритма.
3.2.2. Исходные данные.
3.2.3. Начальные результаты рабозъг алгоритма без эвристик.
3.2.4. Эвристика, ограничивающая область анализа.
3.2.5. Методика формирования остальных эвристик
3.2.6. Влияние и вклад эвристик групп А и В в работу частичного синтаксического
анализатора
3.3. Тестирование модуля патентного поиска.
3.3.1. Описание методики, применяемой при работе модуля патентного поиска
3.3.2. Исходные данные.
3.3.3. Описание эксперимента по тестированию модуля патентного поиска
3.4. Результаты работы модуля встроенного синтаксического анализатора
3.5. Выводы
Заключение.
Список использованных источников


Другими словами, эта модель может дать понять любому человеку, будет ли исследуемое предложение казаться носителю языка правильным или нет. Большинство порождающих теорий но не все предполагают, что синтаксис основан на структуре предложения из непосредствен по составляющих. Порождающие грамматики сосредотачиваются, прежде всего, на форме предложения, а не па его способности передавать тот или иной смысл. Наиболее известны следующие теории, которые носят порождающий характер. Теории, созданные на основе модели Ноама Хомского. Трансформационная грамматика i была создана Хомским в году 8. Глубинная структура предоставляет основные семантические отношения в предложении и нанесена на поверхностной структуре. Хомский полагал, чго во всех языках глубинные структуры очень схожи, а все отличия языков связаны с тем, что одинаковые глубинные структуры скрыты иод различными поверхностными структурами. Теория принципов и параметров ii была сформулирована Ноамом Хомским и Ховардом Лэсником i и стала основополагающим исследованием для многих лингвистов. В настоящее время многие из них придерживаются этой теории и она является на данный момент наиболее совершенной. Конечный набор фундаментальных принципов, которые являются общими для всех языков например, то, что предложение должно иметь подлежащее, даже если о нем в этом предложении прямо не говорится или принцип проективности, о котором подробнее будет сказано ниже. Конечный набор параметров, которые определяют синтаксическую разность среди языков. Например, параметр, который определяет положение подлежащего в предложении i . Английский язык является примером языка, в котором подлежащее стоит первым в повествовательных предложениях, а язык Малагасси является языком с подлежащим, стоящим последнем в предложении 3. Теория управления и закрепления v ii это теория была разработана Хомским в х годах 3, 4, 5. Хомский в этой теории сильно пересмотрел свои предыдущие взгляды 8, 0, 1, но и она была позже опровергнута им же в теории Минимализма iii в 6, а также далее в году 7. Хомским по данной проблеме, но следует учитывать, что именно он был первопроходцем в данной области. Название указывает нам на два направления этой теории управление, которое является абстрактным синтаксическим отношением закрепление, которое имеет дело с референтами местоимений, анафорами и справочными выражениями. Эта теория была первой в группе Теории принципов и параметров, которая также лежит к основе болсс поздней теории Минимализма. Теория Лингвистического Минимализма, как было сказано выше, была основана Хомским в . Он в своей теории стремится к дальнейшему развитию идей сокращения количества трансформаций в смысле словообразований и сокращения количества представлений слова, которые имели место уже в начале х, но были второстепенны в i теории Трансформационной грамматики. Сокращение количества трансформаций это принцип, согласно которому трансформации происходят для того, чтобы поддающиеся толкованию особенности соответствовали особенностям, которые можно не описывать. Пример поддающейся толкованию особенности изменение правильных английских существительных во множественном числе, например , . Слово собаки может быть применено только для нескольких собак, не одной, и таким образом это изменение вносит свой вклад в значение слова и делает его поддающимся толкованию. Английские глаголы склоняются в соответствии с числом существительного, действие которого они характеризуют. В большинстве предложений их склонение только дублирует информацию о числе, которое уже есть у подчиненного существительного, и поэтому ее можно объявить характеристикой, которую описывать не нужно. Сокращение количества представлений слова это принцип, согласно которому грамматические структуры должны существовать с целью, чтобы структура предложения не была большей или более сложной, чем это необходимо для того, чтобы удовлетворить ограничения, накладываемые грамматикой конкретного языка. Оба понятия являются несколько неопределенными, и действительно точная формулировка этих принципов главная область противоречия в исследованиях подобного рода 6, 7.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.290, запросов: 244