+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Информационная технология комплексной обработки информации в рамках логико-аналитической системы на основе расширенных семантических сетей

  • Автор:

    Рабинович, Борис Ильич

  • Шифр специальности:

    05.13.17

  • Научная степень:

    Кандидатская

  • Год защиты:

    2008

  • Место защиты:

    Москва

  • Количество страниц:

    194 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы


СОДЕРЖАНИЕ
СОДЕРЖАНИЕ
СПИСОК СОКРАЩЕНИЙ
ВВЕДЕНИЕ
ГЛАВА I. Особенности систем, основанных на технологии БЗ
1. Основные сущности предметной области
2. Анализ возможностей существующих систем
ВЫВОДЫ К ГЛАВЕ I
ГЛАВА II. Логико-аналитическая обработка разнородной информации
1. Режимы анализа текстов на естественном языке и детализаций
2. Кластерный анализ детализаций телефонных переговоров
ВЫВОДЫ К ГЛАВЕ II
ГЛАВА III. Оптимизация информационной компоненты Системы.:
1. Перенос хранилища знаний из плоских файлов в СУБД Огас1е
2. Интеграция Системы с внешними базами данных
ВЫВОДЫ К ГЛАВЕ III
ГЛАВА IV. Программная реализация разработанной технологии
1. Основные компоненты Системы
2. Интерфейс взаимодействия пользователя с Системой
ВЫВОДЫ К ГЛАВЕ IV
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ПРИЛОЖЕНИЯ
СПИСОК СОКРАЩЕНИЙ

Сокращение Расшифровка
БД База данных
БЗ База знаний
БнЗ Банк знаний
ВБД Внешняя база данных
ГИС Географическая информационная система
ЕЯ Естественный язык
ИПС Информационно-поисковая система
ЯП Лингвистический процессор
ОБД Основная база данных
ОИ Объект исследования
оп Оперативная память
по Программное обеспечение
псид Промышленные средства интеграции данных
РП Рабочее пространство
РСС Расширенные семантические сети
РСУБД Реляционная система управления базой данных
СБД Сервер баз данных
ско Сумма квадратов отклонений
СМИ Средства массовой информации
СпБД Специализированная БД
СУБД Система управления базой данных
ЭР Электронный ресурс
эс Экспертная система
SMS Short Message Service
MMS Multimedia Messaging Service

ВВЕДЕНИЕ
Актуальность работы. В настоящее время наблюдается повсеместный лавинообразный рост потоков разнородной информации, состоящей из сложноорганизованных документов, различных отчетов, электронных писем и пр. [3]. В связи с этим актуальным является разработка технологий и программных средств комплексной обработки разнородной информации. Например, в криминальной милиции примером разнородной-информации могут быть тексты на естественном языке (сводки происшествий, обвинительные заключения, справки по уголовным делам), данные из различных справочников (телефоны, адреса), биллинги телефонных переговоров и др. Информация может храниться в файлах, в Базах Данных (БД) или извлекаться из сети Интернет. Её обработка должна быть максимально автоматизирована, что зачастую предполагает решение сложных логико-аналитических задач (поиск объектов, анализ их связей и др.). Перспективным является разработка технологии и систем, позволяющих осуществить на единой основе агрегацию, хранение и логико-аналитическую обработку разнородной информации достаточно унифицированными средствами [91].
Такая система, ориентированная на обработку текстов естественного языка (ЕЯ), разработана в Институте Проблем Информатики Российской Академии Наук в рамках проекта «Аналитик» и связанных с ним проектов «Криминал», «Икс», «Поток». Созданная система «Аналитик» нашла применение в ГУВД, МВД, в области управления персоналом и анализа СМИ.
Ее особенность заключается в использовании семантико-ориентированного лингвистического процессора, позволяющего отобразить тексты на ЕЯ на структуры знаний, которые образуют Базу Знаний (БЗ). Для представления информации в БЗ используются расширенные семантические сети (РСС). Их отличие от обычных семантических сетей состоит в использовании многоместных фрагментов, связывающих вершины, и кодов фрагментов, которые тоже являются вершинами. Такие сети позволяют с достаточной

текстовых форматах из различных источников - файловой системы, заданных web-сайтов, базы данных.
Результат работы программы — таблица, которая содержит информацию о найденных фактах, связанных с объектами мониторинга, и может экспортироваться в html-формат для формирования отчета или для загрузки в стороннее приложение, работающее с уже структурированными данными. Программа предполагает настройку шаблонов для поиска и классификации фактов самых различных типов. Такие специализированные шаблоны либо приобретаются отдельно, либо создаются пользователем самостоятельно при помощи дополнительной программы «RCO Fact Tuner». Тем не менее, стандартные шаблоны, включенные в комплект поставки «RCO Fact Extractor», позволяют распознавать огромное количество самых разнообразных фактов, но без детальной классификации, т.е., попросту находить события, в которых участвует целевой объект, и извлекать из текста всех прочих фигурантов этих событий, без детализации их ролей.
Помимо собственно программы с графическим интерфейсом для Windows, компания “Гарант-Парк-Интернет” выпускает динамическую библиотеку для разработчиков (SDK — Self Development Kit), на базе которой построен «RCO Fact Extractor» и которая позволяет включать возможности анализа текста в собственные приложения.
Лингвистический процессор программы работает по схеме [22], изображенной на рис. 1.10. Решены такие сложные вопросы, как обработка анафорических ссылок [20]. В работе ЛП можно выделить следующие основные модули:
- модуль распознавания особых текстовых конструкций (паспортных и регистрационных данных, адресов, телефонов, дат) на основании шаблонов, написанных на специальном формальном языке [24];
- правила установления анафорической связи между свободной синтаксической или семантической валентностью, соответствующей

Рекомендуемые диссертации данного раздела

Время генерации: 0.139, запросов: 967