Модели и алгоритмы классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков

Модели и алгоритмы классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков

Автор: Овчинников, Степан Александрович

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Волгоград

Количество страниц: 144 с. ил.

Артикул: 3333057

Автор: Овчинников, Степан Александрович

Стоимость: 250 руб.

Модели и алгоритмы классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков  Модели и алгоритмы классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков 

ОГЛАВЛЕНИЕ
АННОТАЦИЯ.
ВВЕДЕНИЕ
ПЕРЕЧЕНЬ СОКРАЩЕНИЙ, УСЛОВНЫХ ОБОЗНАЧЕНИЙ, СИМВОЛОВ И
ТЕРМИНОВ.
ГЛАВА 1. ОБЗОР МОДЕЛЕЙ И АЛГОРИТМОВ КЛАССИФИКАЦИИ ОБЪЕКТОВ.
1.1 Введение.
1.2 Содержательная постановка задачи классификации.
1.3 Понятие классификации. Разновидности классификаторов.
1.4 Признаки.
1.5 Функция расстояния метрика в пространстве признаков
1.6 Модели текста в методах классификации
1.7 Цели исследования
ГЛАВА 2 МОДЕЛЬ ДЛЯ ПОСТАНОВКИ И РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ ОБЪЕКТОВ, ОПИСАННЫХ ТЕКСТОВЫМИ ПРИЗНАКАМИ. МОДЕЛЬ АНАЛИЗА ТЕМАТИЧЕСКОЙ БЛИЗОСТИ ТЕКСТОВ
2.1 Основные определения.
2.2 Постановка задачи классификации в общем виде.
2.3 Модель анализа тематической близости.
2.4 Постановка задачи классификации на основе анализа близости текстовых
признаков.
2.5 Основные результаты и выводы по главе 2
ГЛАВА 3 АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ ОБЪЕКТОВ НА ОСНОВЕ АНАЛИЗА ТЕМАТИЧЕСКОЙ БЛИЗОСТИ ЕСТЕСТВЕННОЯЗЫКОВЫХ ПРИЗНАКОВ
3.1 Функция тематики слова.
3.2 Функция часть речи в предложении ЧРСл
3.3 Функция тематической близости слов словаря
3.4 Функция тематического ядра БЫ.
3.5 Функция сателлитов БПр, Сл
3.6 Функция расстояния метрика в пространстве слов
3.7 Построение бетамодели текста.
3.8 Функция расстояния метрика в пространстве бетамоделей
3.9 Агрегирование свойств текстовых признаков для формирования модели
ЗЛО Алгоритм классификации
3. Общий алгоритм решения прикладных задач с применением предложенной модели и рассмотренных алгоритмов
3. Основные результаты и выводы по главе 3
ГЛАВА 4 АВТОМАТИЗИРОВАННАЯ СИСТЕМА КЛАССИФИКАЦИИ ОБЪЕКТОВ ПО ЗНАЧЕНИЯМ ЕСТЕСТВЕННОЯЗЫКОВЫХ ПРИЗНАКОВ. ПРОВЕРКА ПРИМЕНИМОСТИ МОДЕЛИ И АЛГОРИТМА К РЕШЕНИЮ ЗАДАЧ КЛАССИФИКАЦИИ.
4.1 Введение. Современное применение классификаций и классификаторов в России
4.2 Архитектура автоматизированной системы КЕТА. Аспекты реализации
4.3 Представление данных в системе КЕТА.
4.4 Решение задачи классификации основных фондов
4.5 Расчет доверительных интервалов серии экспериментов. Оценка экспериментальных данных.
4.6 Основные результаты и выводы по главе 4
ЗАКЛЮЧЕНИЕ.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ


Даже наиболее развитые модели текста (Апресян [], Мельчук [], Жолковский [], Растье [], Красилов []) не позволяют решать задачу классификации наименований с требуемым уровнем эффективности, так как либо чрезвычайно сложны и специфичны, либо не имеют алгоритмического обеспечения предлагаемых в них методов. Естественный язык как объект исследования рассматривается в различных предметных областях, таких как логика, аналитическая философия, филология и герменевтика как наука об интерпретации текстов [], структурная лингвистика, семиотика как наука о знаковых системах [], языкознание. Несмотря на большое количество разработанных лингвистических моделей и методов классификации текстов (Поспелов [0]), задача анализа текстов на естественных языках решается недостаточно хорошо []. Таким образом, актуальной является задача разработки и внедрения алгоритмов классификации и кластеризации объектов, в описании которых присутствуют естественноязыковые признаки. Целью работы является повышение эффективности выполнения классификации объектов, описанных естественно-языковыми признаками на основе тематической близости за счет разработки и применения новой модели, новых метрик в пространствах текстовых признаков, алгоритмов многоуровневой классификации. Под повышением эффективности понимается сокращение трудоемкости относительно ручной классификации при качестве классификации, не уступающем автоматизированным аналогам. Для решения поставленных задач были использованы методы системного анализа, методы искусственного интеллекта, методы интеллектуального анализа данных, а также применялись положения теории объектно-ориентированного проектирования программных систем и теории проектирования реляционных баз данных. Практическая ценность работы заключается в разработке подхода к решению задачи классификации объектов по специальным иерархическим классификаторам на основании тематической близости текстовых признаков, решением важной прикладной задачи классификации по классификатору ОКОФ. Практическая применимость подхода доказана актом о внедрении (Акт № 1 к договору на создание и передачу научно-технической продукции № /2- от июня года) и успешным применением к решению задачи классификации основных фондов по общероссийскому классификатору основных фондов. Достигнуты следующие результаты. Автоматизированная система классификации объектов». Апробация работы. Отраслевом фонде алгоритмов и программ (Свидетельство о регистрации № от ). Основное содержание диссертации нашло отражение в 7 опубликованных научных работах, в том числе в 2 статьях в периодических и научно-технических изданиях, выпускаемых в Российской Федерации, в которых ВАК рекомендует публикацию основных научных результатов диссертаций; в одном свидетельстве об официальной регистрации программы для ЭВМ. Диссертация состоит из введения, четырех глав, выводов и приложений. Диссертация содержит 6 страниц основного текста, рисунков, формул. Библиографический список включает 8 наименований. Общий объем работы -3 страницы. Автоматизированной системы классификации объектов». В первой главе проанализированы существующие подходы к решению задачи классификации, сформулированы основные проблемы, не имеющие решения. Во второй главе описана общая постановка задачи многоуровневой классификации, сформулированы особенности задач рассматриваемого класса, предложено описание текстового признака объекта классификации. Третья глава посвящена разработке алгоритмов анализа текстов для решения задачи классификации, алгоритмов вычисления расстояний (построения метрик) в пространствах слов, моделей текстов, исследованию и расчету пороговых величин, применяемых в модели. В четвертой главе описана «Автоматизированная система классификации объектов», показано решение реальных задач с ее применением. Тема, тематика - то, о чем говорится в тексте. В узком смысле темой может быть «число», «четность», «теорема Виета». В широком смысле темой текста являются, например «Математическая статистика», «Теория чисел». В рамках данного исследования будем полагать, что тема текста есть перечень понятий, о которых говорится в тексте, или категорий, включающих эти понятия. См также: Тематика по Г. Поспелову [6], Тема документа [8], Тема предложения [6].

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.488, запросов: 244