Исследование и разработка автоматизированной системы смысловой обработки текстов в системе управления электронными архивами

Исследование и разработка автоматизированной системы смысловой обработки текстов в системе управления электронными архивами

Автор: Фаррохбахт Фумани Мехди

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2013

Место защиты: Санкт-Петербург

Количество страниц: 126 с. ил.

Артикул: 6550148

Автор: Фаррохбахт Фумани Мехди

Стоимость: 250 руб.

Исследование и разработка автоматизированной системы смысловой обработки текстов в системе управления электронными архивами  Исследование и разработка автоматизированной системы смысловой обработки текстов в системе управления электронными архивами 

СОДЕРЖАНИЕ
ВВЕДЕНИЕ.
ГЛАВА 1. АВТОМАТИЗИРОВАННАЯ СИСТЕМА СМЫСЛОВОЙ ОБРАБОТКИ ТЕКСТОВ
1.1. Обзор существующих программных продуктов анализа текстов.
1.2. Смысловая обработка текстов в полнотекстовых базах данных
1.3. Описание работы системы автоматизированного смыслового анализа текстов.
Выводы.
Глава 2. Архитекту ра системы, процессы и методы обработки ЕЯтскстов.
2.1. Архитектура системы
2.2. Функциональная схема БетТехИгоссБзог
2.3. Формализация представления данных
2.4. Общий процесс смыслового анализа текста
2.5. Методика смыслового анализа текстов в БстТсхРгосеязог.
Выводы.
Глава 3. Инженерия знании в системе БетТсхГРгоссэзог.
3.1. Процесс инженерии знаний в нотации ЮЕБЗ
3.2. Представление знаний с применением семантических сетей.
3.2.1. Основная семантическая есть системы.
3.2.2. Семантическая есть понятия слово
3.2.3. Семантическая есть понятия прилагательное.
3.2.4. Семантическая есть понятия местоименное.
3.3. Таксономии предметной области
3.4. Фреймовая модель представления знаний предметной области.
3.4.1. Фрейм Корпус
3.4.2. Фрейм Домен.
3.4.3. Фрейм Кластер.
3.4.4. Фрейм Пользователь
3.4.5. Фрейм Текст.
3.4.6. Фрейм Раздел
3.4.7. Фрейм Абзац.
3.4.8. Фрейм Предложение.
3.4.9. Фрейм Термин
3.4 Фрейм Словосочетание.
3.4 Фрейм Слово
3.4 Фрейм Толкование.
3.4 Фрейм Тезаурус.
3.4 Фрейм Ключевой термин
3.4 Фрейм Язык.
3.4 Фрейм Буква
3.4 Фрейм Смысловая сеть.
3.4 Фрейм Прилагательное.
3.4 Фрейм Притяжательное.
3.4 Фрейм Относительное
3.4 Фрейм Качественное.
3.4 Фрейм Наречие
3.4 Фрейм Артикль
3.5. Регистрация правил вывода с применением логики предикатов первого порядка.
3.5.1. Правило смыслового поиска по запросу
3.5.2. Правило классификации текстов по предметной области.
3.5.3. Правило смысловой кластеризации текстов.
3.5.4. Правило формирования реферата.
Выводы.
Глава 4. Онтология естественного языка, методы и алгоритмы обработки
4.1. Онтология естественного языка
4.2. Онтология текста на естественном языке
4.3. Методы статистической обработки текстов
4.3.1. Методы взвешивания термов
4.3.2. Взвешивание предложений текста.
4.3.3. Взвешивание абзацев текста.
4.3.4. Взвешивание разделов текста
4.3.5. Взвешивание отношений в семантической сети онтологии текста
4.3.6. Статистические матрицы анализа текстов.
4.4. Пересечение онтологий текстов.
4.4.1. Алгоритм пересечения онтологий текстов.
4.4.2. Оценка степени пересечения онтологий текстов.
4.5. Алгоритм смыслового поиска по запросу
4.6. Алгоритмы классификации текстов по предметным областям
4.7. Алгоритм кластеризации текстов
4.8. Алгоритм реферирования текста.
Глава 5. Онтологическое моделирование и программная реализация
5.1. Систематизация знаний в области онтологии.
5.2. Процесс онтологического инжиниринга.
5.3. Уровни описания и работы с онтологией.
5.4. Природа онтологического исследования.
5.5. Онтологическое моделирование в среде .
5.5.1. Терминология среды .
5.5.2. Структурная модель среды .
5.5.3. Моделирование в
5.6. Извлечение знаний из онтологии с помощью
5.7. Программная реализация и внедрение разработанных структур
5.7.1. Форма ведения онтологии.
5.7.2. Формы смысловой обработки текстов .
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ.
Литература


Проведение смысловой обработки ЕЯ-текстов по предложенной технологии позволит облегчить процесс их обработки, повысить доверие к результатам обработки, снизить издержки на обработку, обеспечить дальнейшее развитие систем смысловой обработки ЕЯ-текстов. Кроме того, результаты, полученные в работе, окажут положительное влияние на конгломерацию частных систем смысловой обработки ЕЯ-тскстов в общую систему смысловой обработки ЕЯ-текстов, поскольку в настоящее время средств, позволяющих осуществить полную смысловую обработку ЕЯ-тскстов, не существует. ЕЯ-тскстов. Архитектура автоматизированной системы смыслового анализа текстов. Онтология предметной области «смысловая обработка текстов на естественном языке», включающая декларативные и императивные знания о грамматиках естественных языков и правила вывода. Методы и алгоритмы смыслового анализа ЕЯ-текстов. Разработанная и программно реализованная автоматизированная система комплексной смысловой обработки ПЯ-текстов. Реализация результатов работы. Результаты работы использованы на кафедре «САПР» в преподавании дисциплины «Онтологический инжиниринг» для магистрантов направления «Информатика и вычислительная техника». Получено 2 акта о внедрении (использовании) результатов диссертационной работы. Апробация работы. Материалы -й научно-технической конференции профессорско-преподавательского состава СПбГЭТУ. Публикации. Основные теоретические и практические результаты диссертации опубликованы в 7 публикациях, включая 3 в изданиях, рекомендуемых ВАК, 3 статьи в международных журналах, 1- материалы научно-технической конференции. Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, и заключения. Основной текст изложен на 6 машинописных страницах с иллюстрациями. Список литературы включает наименования. Несмотря на широкое использование мультимедиа, текст остается одним из основных видов информации в большинстве электронных хранилищ. Разработка эффективных подходов к обработке текстов с целыо фильтрации, формирования смыслового портрета, навигации но базе текстов и т. Существующие подходы к анализу текстов можно разбить на два класса. К первому классу относятся простые, быстрые, не зависящие от языка и предметной области, но грубые механизмы анализа; чаще всего это подходы, использующие статистические методы. Второй класс формируют достаточно изощренные, дающие хороший результат, но сравнительно медленные подходы, зависящие от языка и предметной области; обычно они основаны на лингвистических методах. Эффективным можно считать такой подход, который сочетал бы в себе быстроту и независимость от языка алгоритмов первого класса с высоким качеством обработки второго. Выбор метода анализа информации во многом определяет качество получаемых итоговых результатов и облегчает возможность принятия решения в реальных условиях [I]. Эта проблема особенно актуальна в экономических системах, системах управления, где правильно выбранные методы и алгоритмы анализа и обработки данных существенно определяют качество получаемого решения. Сейчас для обработки данных широко применяются компьютерные и информационные технологии. Задача выбора системы или процедуры анализа данных с помощью информационных технологий является многокритериальной и от правильного сс решения зависит качество результирующих показателей. В настоящее время разработано множество технологий анализа информации. В данном обзоре представлены наиболее известные разработки как российских, так и зарубежных компаний. Существует большое количество систем, разработанных в основном специалистами университетских центров и используемых для своих нужд. В данном обзоре они НС описываются, так как принципы работы системы смыслового анализа текстов сходны и опираются на научный потенциал разработчиков, накопленный ранее. В список также не включены системы анализа текстов, разработанные для больших поисковых серверов, таких как Google, Yahoo, Yandex, OZON, Rambler и т. В основном это комплексы, настроенные на работу в Интернете. OLАР-тсхнологии. Сегодня все больше организаций, в том числе и банков, используют в качестве инсгрумснта анализа своей деятельности OLAP -технологии [I]. OLAP-техиологии поддерживают различные аналитические приложения.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.268, запросов: 244