Система обработки неструктурированной текстовой информации на основе объектного подхода для повышения эффективности информационного поиска

Система обработки неструктурированной текстовой информации на основе объектного подхода для повышения эффективности информационного поиска

Автор: Тригуб, Наталья Александровна

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Москва

Количество страниц: 189 с. ил.

Артикул: 2743989

Автор: Тригуб, Наталья Александровна

Стоимость: 250 руб.

СОДЕРЖАНИЕ
СПИСОК СОКРАЩЕНИЙ
ВВЕДЕНИЕ.
1 АЛЬТЕРНАТИВЫ ДЛЯ РАЗРАБОТКИ ЕЯСИСТЕМ.
1.1 Функционирующие ЕЯсистемы.
1.1.1 Галакт икаЮОМII
1.1.2 Экспресс Досье
1.1.3 Этап
1.1.4 Выводы
1.2 Объект исследования
1.2.1 Теория синтаксиса.
1.2.2 Порядок слов в предложении
1.2.3 Теория текста.
1.2.4 Нефакторы, характерные для русского языка
1.2.5 Выводы
1.3 Постановка задачи по разработке ЕЯсистемы.зо
1.3.1 Знания
1.3.2 Понимание ЕЯ как прикладная область ИИ
1.3.3 Цели, критерии и ограничения
1.3.4 Выводы
1.4 Теоретический базис для разработки ЕЯсистем.
1.4.1 Принципы и подходы к разработке ЛП
1.4.1.1 Формальнограмматический подход.
1.4.1.2 Вероятностностатистический подход
1.4.1.3 Объектноориентированный подход.
1.4.2 Модели представления знаний.
1.4.2.1 Логическая модель ПЗ
1.4.2.2 Сетевая модель ПЗ.
1.4.2.3 Фреймовая модель ПЗ.
1.4.2.4 Продукционная модель ПЗ.
1.4.3 Декларативный и процедурный подходы к ПЗ в модулях ЛП
1.4.4 Выводы
2 ПРИНЯТИЕ РЕЩЕНИЯ. РАЗРАБОТКА МЕТОДА.
2.1 Оценка исходного множества альтернатив.
2.2 Концептуальная постановка задачи построения АТЕЯ.
2.3 Принципы объектного подхода
2.4 Функциональная организация АТЕЯ
2.5 Математическая постановка задачи построения АТЕЯ.
3 АТЕЯ. АЛГОРИТМИЗАЦИЯ ОТДЕЛЬНЫХ МОДУЛЕЙ
3.1 Ограничения входного информационного потока
3.2 Модуль морфологического анализа
3.2.1 Дерево поиска
3.2.2 Алгоритм морфологического анализа
3.3 Модуль объектного анализа.
3.3.1 Сравнение синтаксического анализа с О А.
3.3.2 Алгоритм объектного анализа для каждого предложения
3.3.2.1 Задача классификации
3.3.2.2 Формирование связей внутри предложений
3.3.3 Алгоритм объектного анализа для формирования связей и отношений между объектными структурами предложений
4 АТЕ Я. КОМПЬЮТЕРНАЯ РЕ АЛ ИЗ АЦИЯ.
4.1 Функция АТЕЯ предоставляемая для вызова.
4.2 Описание программных структур модуля МА в АТЕЯ
4.3 Описание структур объектного модуля АТЕЯ
4.4 Примеры. зо
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


В качестве источников информации всеми продуктами семейства могут использоваться печатные материалы, сообщения электронных СМИ, аналитические отчеты, справочные БД различных ведомств, сведения с сайтов Интернет. Переработанные данные накапливаются в БЗ, обеспечивая стабильность и преемственность аналитической работы в организации. БЗ, в результате такой ручной работы оператором наполняется БЗ системы. БД, причем анализ осуществляется путем визуального построения аналитиком формальных запросов к системе и последующего изучения полученных результатов. Система Экспресс-Досье. Факты предназначена для экспресс-анализа складывающейся обстановки вокруг объекта исследований, путем выявления связей между самими объектами интереса и происходящими событиями. Система позволяет обрабатывать собранную информацию путем выделения из нее основных фактов и знаний об объектах мониторинга, регистрации связей объектов друг с другом и происходящих с ними событий. Система Экспресс-Досье. Факты поставляется вместе с настроенной моделью ПО, включающей список объектов, отношений и событий, представляющих интерес для заказчика. Система Экспресс-Досье. Объекты предназначена для глубокого структурированного анализа событий, объектов и их взаимосвязей. Система позволяет составлять сложные поисковые запросы по детально описанным характеристикам объектов и производить статистические исследования собранных данных по различным критериям. В отличие от продукта Экспресс-Досье. Факты система поддерживает более сложную структуру БЗ. Система Экс пресс-Досье. Объекты характеризуется хорошо структурированной информационной моделью, а также развитой типизацией информационных элементов, иерархической структурой наследования типов и наличием большого количества предопределенных классификационных связей для каждого типа. В среде Экспресс-Досье. Объекты окружающий мир, а точнее ПО, имеет четкое формальное описание, учитывающее особенности составляющих его элементов, каждый из которых ложится в ячейку, определенную для него пользователем. Экспресс-Досье. Объекты позволяет проводить поиск элементов ПО по атрибутам. Для сущностей пользователь задает поисковый запрос, выбирая тип сущности, ее свойства и одно или несколько значений свойств. Поиск элементов ПО по связям позволяет получить все связи выбранной сущности с другими элементами предметной области. Экспресс-Досье. Объекты позволяет осуществить поиск элементов ПО по определенному типу связи. В Экс пресс-Досье. Результатом статистического запроса является визуализация данных в табличном виде и в виде графика, которые группируются по критериям, определенными пользователем. Система Экспресс-Досье. Рейтинг предназначена для анализа количественных и качественных данных по упоминаниям объектов мониторинга в СМИ, выявление тенденций и проблемных областей, получение статистических данных по различным срезам. В отличие от других продуктов семейства система дополнительно поддерживает работу с экспертными оценками и рейтинг-анализ. Разнообразные аналитические функции системы обеспечивают получение статистических данных по различным срезам, выявление тенденций и проблемных областей, сопоставление необычных изменений характера упоминания объектов с произошедшими событиями. В Экспресс-Досье. Рейтинги учитываются следующие основные характеристики: характер упоминания объекта (положительный, нейтральный, отрицательный), критичность высказывания, категория упоминания (личный профиль, бизнес, работа, политика), наличие в данной статье прямой речи этого объекта (да, нет). Экспресс-Досье. Рейтинги обеспечивает получение статистикой информации о характере упоминаний объекта мониторинга относительно его сферы деятельности. Из приведенного выше описания видно, что продукты семейства Экспресс-Досье, также как и некоторые другие ЕЯ-системы, используют ОП в классической его форме. А именно: создается в ручную БЗ, либо настраивается ранее сформированная модель ПО, и целью ЕЯ-системы является найти в исходном тексте объекты и связи заданной ПО. В отличии от таких ЕЯ-систем и классического взгляда на ОП, разработанный АТЕЯ, как уже говорилось выше, не требует построенной в ручную модели ПО или заранее выделенных объектов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.247, запросов: 244