Исследование и разработка инфологического подхода для построения тематических антологий при мониторинге интернет-среды

Исследование и разработка инфологического подхода для построения тематических антологий при мониторинге интернет-среды

Автор: Кокорин, Павел Петрович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2010

Место защиты: Санкт-Петербург

Количество страниц: 149 с. ил.

Артикул: 4743323

Автор: Кокорин, Павел Петрович

Стоимость: 250 руб.

Исследование и разработка инфологического подхода для построения тематических антологий при мониторинге интернет-среды  Исследование и разработка инфологического подхода для построения тематических антологий при мониторинге интернет-среды 

Оглавление
Основные обозначения и сокращения
Введение.
Положения, выносимые на защиту.
Глава 1. Аналитический обзор существующих методов построения информационнопоисковых систем
1.1. Программы лингвистическою анализа текстов
1.2. Корпусная лингвистика
1.3. Системы аналитической обработки текстов
1.4. Современные подходы к поня тийной визуализации семантического
содержания текстов
Выводы по главе 1.
Глава 2. Мифологический подход семантикосмыслового анализа текстов
2.1. Логистиколингвистический подход к обработке текстов.
2.2. Ассоциативнопонятийная идентификация
2.3. Эволюционная эпистемология.
2.4. Смысл как составная часть проблемноориентированной среды
2.5. Память и знание
2.6. Контекстиоинтсрпретируемая семантика
Выводы по главе 2.
Глава 3. Разработка инфологического подхода к аналитическому мониторингу проблемноориентированных предметных областей.
3.1. Преобразование формата документа.
3.2. Формат текста в нормальной форме.
3.3. Структурная декомпозиция текста
3.4. Формат компьютерного представления семантики текста
3.5. Метод формирования терминологических ядер предметных антологий.
3.6. Методы оценки тематической близости текстов
3.7. Тематическая кластеризация текстов.
3.8. Визуальнодинамический интерфейс представления понятийных ядер
тематических топиков
3.9 Аналитическое реферирование текстов.
3 Перспективные направления развития инфологических систем
Выводы по главе 3.
Глава 4. Реализация системы аналитического мониторинга Интернетсреды.
4.1. Кластеризация тем научных исследований.
4.2. Аннотационные системы. Музейные системы
4.3. Новостные системы
Выводы по главе 4
Глава 5. Экспериментальная апробация
5.1. Испытания методов тематической кластеризации
5.2. Испытания метода аналитического реферирования текстов.
Выводы по главе 5
Заключение.
Список использованной литературы


Диссертация объемом 0 машинописных страниц содержит введение, 5 глав и заключение, список литературы (2 наименования), рисунка, 3 таблицы и 2 приложения. В первой главе рассматривается современное состояние решения задач семантического анализа текстов, их параметрической оценки и аналитической обработки, построения проблемно-ориентированных тезаурусов и глоссариев. Аналитический обзор существующих методов компьютерной лингвистики (системы АОТ, Mystem, МедиаЛингва и др. Многие функции лексики, прагматики и грамматики, входящие в понятие «лингвистика», обычно ориентируются на специфические свойства вербального мышления человека. И, следовательно, текстуальный интерфейс при своей компьютерной реализации требует введения специфических логистико-лингвистических методов и операций. В главе приводится обзор современных подходов понятийной визуализации семантического содержания текстов: системы Semantic Explorer, TopSOM, «Визуальный словарь», CLAS1TEX+, Wolfram|AIpha. Приводится описание системы VisualWorld. Информационно-поисковые системы, основанные на технологиях Web 3. Semantic Web и пр. Эти технологии не ориентированы на семантический анализ содержания текстов и не поддерживают интеллектуальные функции: самообразования, аналитического исследования, тематической кластеризации, составления аннотаций и рефератов, установления ассоциативной и понятийной эквивалентности текстов. В связи с этим предлагается использовать инфологический подход, основа которого состоит в итерационном процессе формирования тематических знаний посредством выявления тематических антологий, выявления их тезаурусов и глоссариев, а также построения иерархий онтологических понятий и составления семантического окружения содержания выбранных текстов. Во второй главе рассматриваются основы вербального мышления, эволюционной теории языка и их компьютерная реализация для расширения поискового интерфейса информационно-поисковых систем. Рассмотренные аспекты показали, что для семантико-смыслового познания необходимо актуализировать объектное содержание, т. Отсюда следует необходимость выбора или выявления набора актуальных тематических антологий. Показано возникновение потребности иерархического упорядочения слов и понятий в виде совокупности связанных слов. В третьей главе рассмотрены возможные архитектуры инфологической системы, уточнены понятия тезауруса и глоссария, определены основные операции над текстом (введены правила работы с текстом в нормальной форме, сформулированы ограничения на преобразование форматов текстов). Разработан специфический нормализованный формат текстов (TNF), сохраняющий семантико-смысловое содержание. Дан формализм нормализации текстов и структурной декомпозиции текста. Предложены методы формирования понятийных ядер из глоссариев предметных антологий, методы оценки эквивалентности и семантической близости текстов, метод аналитического реферирования текстов. Четвертая глава посвящена анализу прикладных возможностей предлагаемого подхода. Разработан комплекс программ для нормализации текстов, их структурной декомпозиции и формирования предметных антологий. Архивные системы (кластеризация научно-исследовательских тем). Новостные системы. Анпотационные системы (музейные системы, self-reference). В пятой главе для оценки работоспособности системы проведена экспериментальная апробация на основе данных из новостных ленг Интернет (RSS Feeds). Представлены результаты испытаний различных методов для антологической (предметно-тематической) кластеризации. Показано, что для «новостных» текстов предпочтительным является графовый метод выделения связных компонент. Приводится сравнение аннотаций, полученных с помощью предложенного метода, системы TextAnaiyst и RSS-аннотаций. Показана эффективность предложенного метода аналитического реферирования для «новостных» текстов. В заключении содержится перечень задач, которые были решены в результате диссертационного исследования. Приложение 1 и приложение 2 содержат примеры и результаты работы предложенных алгоритмов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.197, запросов: 244