Методы и программные средства для анализа документов на основе модели предметной области

Методы и программные средства для анализа документов на основе модели предметной области

Автор: Сидорова, Елена Анатольевна

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Новосибирск

Количество страниц: 125 с. ил.

Артикул: 3304672

Автор: Сидорова, Елена Анатольевна

Стоимость: 250 руб.

Методы и программные средства для анализа документов на основе модели предметной области  Методы и программные средства для анализа документов на основе модели предметной области 

ВВЕДЕНИЕ.
1 ОБЗОР ПОДХОДОВ К АНАЛИЗУ ТЕКСТОВ
1.1 Развитие информационного сервиса
1.2 Классы задач.
1.3 Подходы к анализу текстов
1.4 Системы анализа текстов
2 ПРЕДСТАВЛЕНИЕ ЗНАНИЙ.
2.1 Онтология
2.1.1 Понятие онтологии.
2.1.2 Определение онтологии.
2.1.3 Назначение онтологии
2.2 Модель информационного пространства системы
2.2.1 Информационный объект структура, контекст, контент.
2.2.2 Определение информационноо пространства системы
2.2.3 Текстовый ресурс
2.3 Лингвистическая база знаний
2.3.1 Формальное представление структуры текста.
2.3.1.1 Сегмент
2.3.1.2 Модель документа.
2.3.2 Словарь.
2.3.2.1 Представ н не словарной статьи.
2.3.2.2 Морфологические типы словаря лексем
2.3.2.3 Иерархия классов словаря.
2.3.2.4 Тезаурус.
2.3.3 Описание фактов.
2.3.3.1 Семантические ограничения
2.3.3.2 Структурные ограничения
2.3.3.3 Схема факта
2.3.3.4 Типизация схем фактов
2.4 Особенности иредетявления знаний
3 ТЕХНОЛОГИЯ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ.
3.1 Словарный компонент
3.1.1 Архитектура модуля словаря
3.1.2 Сборка словокомплексов
3.1.3 Модули автоматизированной настройки словаря.
3.1.3.1 Общая схема обучения.
3.1.3.2 Модуль классификации.
3.1.3.3 Тематизация
3.1.3.4 Выявление стоптерминов
3.2 Конструктор онтологии
3.3 Конструкюр схем фактов.
3.3.1 Методология создания схем фактов
3.3.2 Формирование внутреннего представления схем фактов
3.3.2.1 Обеспечение корректности и сходимости
3.3.2.2 Планирование.
3.4 Фактографический анализ текста
3.4.1 Сегментация текста
3.4.2 Сборка фактов.
3.4.2.1 Удовчетвореиие структурным ограничениям
3.4.2.2 Удовлетворение семантическим ограничениям
3.4.3 Формирование контента текстового ресурса
3.4.3.1 Идентификация объектов.
3.4.3.2 Контроль корректности данных.
3.5 Поддержка актуальности данных
4 РЕАЛИЗАЦИЯ И ПРАКТИЧЕСКИЕ ПРИЛОЖЕНИЯ.
4.1 Особенности программной реализации
4.1.1 Архитектура системы анализа документов
4.1.2 Словарный компонент.
4.1.2.1 Система классов
4.1.2.2 Пользовательский интерфейс.
4.1.3 Модуль анализа документов.
4.1.4 Качество работы системы анализа.
4.2 Практические приложении технологии
4.2.1 Мос
4.2.1.1 Модель делового письма.
4.2.1.2 Система знаний ЬЮос
4.2.1.3 Общая схема анализа 1пОос
4.2.2 Портал знаний по археологии и этнографии.
4.2.2.1 Система знаний портала
4.2.2.2 Техно югия сбора онтологической информации о ресурсах
4.2.2.3 Индексирование новостных сообщений
4.2.2.4 Индексирование научных статей.
ЗАКЛЮЧЕНИЕ
ПРИЛОЖЕНИЯ
Приложение 1. Сгатисшческне функции распределении.
Пр иложение 2. Структура база данных информационной системы ЛИТЕРАТУРА
ВВЕДЕНИЕ


Информация это сведения об окружающем мире, которые являются объектом хранения, преобразования, передачи и использования. Основным инструментом, с помощью которого осуществляется сегодня информирование спешшнстов, являются различные виды документов носители научной и технической информации. Для расширения сферы научной и деловой коммуникации в середине XX в. В процессе развития системы информационных коммуникаций сформировались три вида информационною обслуживания документальное, фактографическое и концептографическое . Сущность докумеитсыьного обслуживания заключается в том, что информационные потребности удовлетворяются путем предоставления первичных документов, необходимые сведения из которых пользователи извлекают самостоятельно. Обычно документальное обслуживание осуществляется в два этапа сначала пользователю предоставляется некоторая совокупность релевантных его запросу вторичных документов библиографическое обслуживание, а затем, после ручного отбора пользователем из этой совокупности определенного числа документов, ему предоставляются сами первичные документы библиотечное обслуживание. Таким образом, потребность в информации при документальном обслуживании удовлетворяется опосредованно, через первичный документ. В отличие о г документального обслуживания фактографическое предполагает удовлетворение информационных потребностей непосредственно, т. Эти сведения, также релевантные запросам пользователей, предварительно извлекаются из первичных документов и после определенной их обработки предоставляются пользователям. Если в случае документального и фактофафического обслуживания пользователю информации предоставляются документы или сведения, извлеченные из информационного потока, так сказать, в натуральном виде извлекается то, что есть в этом потоке, то при концептографическом обслуживании все эго документы и сведения подвергается интерпретации, оценке, обобщению. В результате такой интерпретации формулируется так называемая ситуативная информация, содержащая в себе оценку рассматриваемых сведений, тенденции и перспективы развития отдельных научных и технических направлений, рекомендации и пр. Все виды информационного обслуживания функционируют на основе своих специфичных рядов вторичных документов. По сути дела каждая из разновидностей обслуживания сводится к созданию своего ряда вторичных документов и доведению их до потребителей различными средствами и в различных режимах информационного обслуживания. Так, в сфере документального обслуживания сформировался ряд вторичных документов, таких как библиографическое описание, аннотация и библиографический обзор, основная функция которого ориентация потребителей информации в документальном потоке. Эти документы раскрывают форму и содержание первичных документов с той степенью полноты и детальности, которая бы позволила, с одной стороны, достаточно точно идентифицировать документ в документальном потоке, а с другой, помочь потенциальному пользователю принять решение о целесообразности обращения к первичному документу. Задача документов этого ряда прежде всего аннотации как типичного представителя максимально полно отразить формальные признаки и тематическое содержание свертываемого документа на основе документографического анализа, сущность которого сводится к выявлению в тексте первичных документов метаинформативных элементов текста. В качестве таких элементов текста могут выступать заглавия ко всему тексту, его разделам, абзацам и даже еще меньшим структурным единицам. Уровень детальности точности свертывания определяется размерами аннотируемого документа, его структурой, жанром и практическими соображениями целевым и читательским назначением, но чаще всего свертывание в случае библиографического анализа производится на уровне, близком к максимальному макросвертывание, т. В сфере документального обслуживания в настоящее время интенсивно ведутся исследования но созданию систем автоматической переработки текстов, прежде всего по машинному аннотированию, реферированию, индексированию, переводу.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.210, запросов: 244