Логико-лингвистический интегратор русскоязычных текстов для информационной системы в строительстве

Логико-лингвистический интегратор русскоязычных текстов для информационной системы в строительстве

Автор: Марлов, Александр Владимирович

Год защиты: 2004

Место защиты: Москва,Воронеж

Количество страниц: 166 с.

Артикул: 2633517

Автор: Марлов, Александр Владимирович

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Стоимость: 250 руб.

1.1 Классификация автоматизированных систем обработки текстовой информации
1.2 Анализ лингвистических подходов к формализации языка
1.3 Анализ моделей обработки текстовой информации.
1.3.1 Классификация моделей текстовой информации
1.4 Анализ методов автоматической обработки классификации текстовой информации.
1.5 Анализ существующих информационных систем автоматизированного анализа текстовой информации.
1.6 Выбор показателей эффективности извлечения дополнительной информации из множества семантически связанных текстов. Постановка научной задачи
1.7 Общая схема решения задачи. Частные задачи исследований
Выводы
ГЛАВА 2 ФОРМАЛИЗАЦИЯ И СЕМАНТИЧЕСКИЙ АНАЛИЗ ТЕКСТОВОЙ ИНФОРМАЦИИ
2.1 Формализация текстовой информации.
2.1.1 Матрица лексических связей текста.
2.1.2 Текст как ориентированный граф
2.1.3 Представление объектов ситуаций предметной области в виде семантической сети
2.1.4 Описание объектов ситуаций предметной области в виде фреймов.
2.2 Семантический анализ текстовой информации.
2.2.1 Табличный метод анализа текстовой информации
2.2.2 Методы анализа текста с семантической ориентацией.
2.2.3 Классификация текстов на основе их семантического анализа.
2.2.3.1 Ассоциативный метод порождения текста в задаче классификации.
2.2.3.2 Метод проведения тематического анализа текста с выявлением сверхфразовой структуры
Выводы
ГЛАВА 3 РАЗРАБОТКА СПЕЦИАЛЬНОГО МАТЕМАТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ФРАГМЕНТАРНОГО ЛОГИКОЛИНГВИСТИЧЕСКОГО ИНТЕГРАТОРА РУССКОЯЗЫЧНЫХ ТЕКСТОВ.
3.1 Алгоритм графематической обработки текста.
3.2 Алгоритм морфологического анализа текста
3.3 Алгоритм фрагментационной обработки текста
3.4 Алгоритм синтаксической обработки текста
3.5 Алгоритм объединения результатов фрагментационной и синтаксической обработки текста.
3.6 Модель семантической обработки текста.
3.7 Алгоритм формирования терминологического портрета текста.
3.8 Алгоритм рубрицирования текста
3.9 Алгоритм извлечения дополнительных данных.
Выводы
ГЛАВА 4 РАЗРАБОТКА АВТОМАТИЗИРОВАННОГО РАБОЧЕГО МЕСТА АНАЛИЗА РУССКОЯЗЫЧНЫХ ТЕКСТОВ В СТРОИТЕЛЬСТВЕ С ИСПОЛЬЗОВАНИЕМ ФРАГМЕНТАРНОГО ЛОГИКОЛИНГВИСТИЧЕСКОГО ИНТЕГРАТОРА
4.1 Основные результаты разработки математического обеспечения автоматизированного рабочего места.
4.2 Логическая структура и особенности функционирования автоматизированного рабочего места.
4.3 Характеристика используемого общего программного обеспечения
4.4 Порядок работы оператора на автоматизированном рабочем месте.
4.5 Алгоритм проведения исследований основных характеристик автоматизированного рабочего места.
4.6 Результаты апробации автоматизированного рабочего места
Выводы.
ЗАКЛЮЧЕНИЕ.
ЛИТЕРАТУРА


Информация, поступающая на вход системы может быть структурированной и неструктурированной слабо структурированной . Структурированная информация представляет собой текстовые данные среди которых выделены значимые элементы, установлены смысловые взаимосвязи между фрагментами, определены раскрываемые темы и т. Неструктурированная информация представляет собой текстовые данные с выделенными простейшими элементами заголовок, автор и т. Она может обрабатываться ручным способом либо с использованием неструктурированных СОТИ. Примером неструктурированной информации являются сообщения информационных агенств, размещаемые в Интернете и др. В зависимости от вида входной текстовой информации СОТИ подразделяются на структурированные и неструктурированные. По периоду актуальности обрабатываемой информации, СОТИ разделяются на статические и динамические. Статические СОТИ предназначены для обработки массивов текстовых данных, не изменяющихся с течением времени, таких как сборники законов, справочники, подборки документов по определнной тематике и др. Динамические СОТИ более сложные, поскольку при поступлении новой информации требуют перенастройки. В свою очередь динамические СОТИ в зависимости от способности изменения своего состояния и поведения классифицируются на адаптивные и неадаптивные. Адаптивные СОТИ изменяют свои состояние и поведение параметры, структуру, алгоритм функционирования и др. По способности к обучению, то есть к накоплению новых знаний при обращении к учителю или обобщения наблюдаемых фактов, СОТИ делятся на обучающиеся и детерминированные. Первые способны к обучению, а вторые нет. Кроме вышеперечисленных классификационных признаков целесообразно классифицировать СОТИ в соответствии с решаемыми ими задачами. Описание назначения существующих СОТИ данных классов с примерами атрибутов конкретных систем приведено в приложении А. Обобщая полученные результаты классификации СОТИ, следует отметить, что, вопервых, одни системы могут решать сразу несколько перечисленных выше задач, другие только одну конкретную, вовторых, разные системы могут использоваться совместно в виде единого комплекса, либо включаться в состав более сложных систем обработки текстовой информации. В каждой СОТИ из вышеперечисленных классов осуществляется формализация языка, эволюция развития которой основывалась на следующих основных лингвистических подходах. Впервые, попытка выделить универсальное начало в естественных языках была предпринята в работе И. Ньютона Об универсальных языках . Он считал, что общность языков обусловлена их предназначением для обозначения субстанций духов или тел, которые у всех народов одинаковы. Носителем слов, обозначающих отношения предикаты является субъект предиката. Каждый корень универсального языка должен относиться к какойто одной субстанции например, должна быть специальная буква для обозначения видов людей, ангелов, домов и т. Однако полный перечень субстанций не приводится. Достоинством работы является впервые предложенная оценочная шкала использования грамматических префиксов и аффиксов, типа плохойхороший, большоймаленький и т. Современная интерпретация шкал в Московской лингвистической школе беднее Ньютоновской в ней используются только две степени полюса, только по трем шкалам ВопАлбВоп, МапАпбМап, УегАпбуег. Кроме того, Ньютоном проработаны глубинные падежи отношения, связывающие участника ситуации с ситуацией. Однако, в работе приведен один единственный пример с глаголом рисовать с субъектом рисованияхудожником, что не позволяет достоверно спроектировать ньютоновские падежи на какуюлибо современную систему. Достаточно подробно в работе разработана категория времени шкала времени. Однако, как показывает анализ, предложенная временная шкала носит идеализированный характер и не в полной мере подходит к естественному языку, что не позволяет ее использовать для формальной модели времени. Весомый вклад в развитие лингвистики внес Г. Лейбниц. В своей работе О словах 0, он впервые категоризировал лексику на собственную и нарицательную. Отмечено, что все имена собственные произошли от нарицательных общих.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.232, запросов: 244