Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом

Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом

Автор: Холодова, Светлана Анатольевна

Шифр специальности: 05.13.06

Научная степень: Кандидатская

Год защиты: 2002

Место защиты: Москва

Количество страниц: 168 с. ил

Артикул: 2322613

Автор: Холодова, Светлана Анатольевна

Стоимость: 250 руб.

Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом  Автоматизация построения гипертекстовых систем на основе текстовой информации тезаурусным методом 

Содержание
Введение.
1. Глава 1. . . . . . . . . . .
1.1 Понятие и соотношение текста, гипертекста и тезауруса. .
1.2. Обзор существующих гипертекстовых систем. .
1.3. Определение этапов построения гипертекста. .
1.4. Обзор существующих методик автоматизации формирования гипертекстов в целом и методик для каждого из этапов формирования. . . . . . . . . .
1.5. Анализ существующих гипертекстовых систем и методов их построения. .
1.6. Постановка задачи.
Выводы по первой главе. .
Глава 2
2.1. Концептуальная модель текста и гипертекста и тезауруса в ракурсе преобразования первого во второй с использованием
третьего и ее математическое описание. .
2.2. Автоматизация выделения терминов предметной области из текста при наличии тезауруса предметной области. .
2.3. Построение частного тезауруса при наличии общего. . .
2.4. Условия возможности построения гипертекстовой системы
по частному тезаурусу.
2.5. Ограничение применения методики с точки зрения целесообразности.
2.6. Требования, предъявляемые к частному тезаурусу. . .
Выводы по второй главе. .
Глава 3
3.1. Методики и алгоритмы автоматизированного построения гипертекстовой системы на основе текста тезаурусным методом
3.2. Построение списка ключевых терминов.
3.3. Построение общего тезауруса с коррекцией словаря ключевых
терминов.
3.4 Отыскание информационных статей терминов. . . .
3.5. Формирование гипертекстовых ссылок . . . .
Выводы по третьей главе
Глава 4
4.1. Программный комплекс ТС
4.2. Структура программного комплекса . . . .
4.3. Получение входных данных
4.4. Формирование частного тезауруса. . . . . .
4.5. Исследование влияния параметров функций семантических
полей на достоверность выборки. . . . . . .
Выводы по четвертой главе. . . . . . . .
Заключение. .
Список использованных источников


Вопрос о стоимости построения семантического тезауруса по предметной области пока еще стоит, но по многим предметным областям уже существуют отраслевые тезаурусы [, 6, 9], на основе которых могут быть дешево построены семантические, и существуют коммерческие программные продукты, строящие семантические тезаурусы автоматизированно и отраслевые автоматически [, ]. При расширении области применения семантических тезаурусов цена на программные продукты, реализующие их автоматизированное построение, будет уменьшаться, а само количество семантических тезаурусов увеличиваться. Автоматизация ряда этапов технологическою процесса преобразования текста в гипертекст. При этом предъявляются требования к качеству конечного продукта не только с точки зрения формальных признаков, как то: структура графа гипертекстовой сети, эргономические характеристики текстовых фрагментов, но и с точки зрения соответствия отношений, выраженных гипертекстовыми ссылками, семантике предметной области, что в конечном итоге определяет качество получаемого программного продукта с точки зрения удобства семантического поиска в нем. Анализ существующих этапов технологического процесса преобразования текста в гипертекст. Анализ существующих методов автоматизации для технологического процесса преобразования текста в гипертекст в целом и для каждого из этапов отдельно. Выявление ограничений использования для каждого из существующих методов автоматизации. Построение математической модели предметной области. Разработка с учетом предложенной математической модели методик и алгоритмов, реализующих автоматизацию преобразования текста в гипертекст. Определение ограничений использования методик. Разработка программного пакета, реализующего предложенные методики и алгоритмы. Разработка методик построения частного тезауруса при отсутствии общего. Разработка методик коррекции частного тезауруса. Определение критерия семантической близости терминов и введение функций, его реализующих. Ввод методов повышения производительности предложенных алгоритмов. Научная новизна. Во впервые предложенной методике автоматизации технологического процесса формирования гипертекста на основе текста и тезауруса по предметной области. Во впервые предложенном и впервые отраженном в математической модели текста и гипертекста принципе объединения видов семантических связей но их структуро-графообразующим свойствам с целью соблюдения в создаваемой гипертекстовой системе принципа общезначимости при переходе по ссылкам. Во впервые предложенной методике построения, анализа и коррекции частного тезауруса основанной на использовании алгоритмов и утверждений теории графов. Во впервые найденных оптимальных значениях параметров данных функции. Практическая значимость результатов. CD-дисках или представленных для коммерческого пользования в Internet. Обслуживание и ремонт РАВ» в ОАО «СММ» в году в рамках Госконтракга №2СТ-/9 от февраля г, п. Результаты исследований в части методики автоматизации технологического процесса формирования гипертекста на основе текста и тезауруса по предметной области, а также методики построения, анализа и коррекции частного тезауруса внедрены рамках разработки эксплуатационной документации для изделий ряда 1НЛ1-Е, разрабатываемых по теме «Панцирь-С1» в году в рамках ОКР «Навигационная система для комплекса К6-Е». Основные положения работы. В ряде случаев, когда существует общий семантический тезаурус предметной области, и текстовый массив, на основе которого предполагается строить гипертекст, имеет семантическую структуру, семантический граф тезауруса которой в ряде узлов и дуг совпадает с общим семантическим тезаурусом предметной области, можно построить автоматизированно некоторую гипертекстовую систему, нуждающуюся в дальнейшем редактировании, структура графа которой основана на тезаурусе предметной области, а информационные статьи являются частями исходного текста. Качественная гипертекстовая система должна быть построена в соответствии с принципом общезначимости. В соответствии с данным принципом к частному семантическому тезаурусу предметной области предъявляются определенные (изложенные в работе)требования. С учетом вышеозначенных принципов и требований математическая модель предметной области (предложенная другими исследователями) должна быть откорректирована.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.489, запросов: 244