+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Взаимодействие информационных и лингвистических методов в задачах анализа качества научных текстов

Взаимодействие информационных и лингвистических методов в задачах анализа качества научных текстов
  • Автор:

    Швец, Александр Валерьевич

  • Шифр специальности:

    05.13.17

  • Научная степень:

    Кандидатская

  • Год защиты:

    2015

  • Место защиты:

    Москва

  • Количество страниц:

    131 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
Глава 1. ИССЛЕДОВАНИЕ НАРУШЕНИЙ В ТЕКСТАХ НАУЧНОЙ СФЕРЫ 
1.1. Типология нарушений в научных публикациях


ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ

Глава 1. ИССЛЕДОВАНИЕ НАРУШЕНИЙ В ТЕКСТАХ НАУЧНОЙ СФЕРЫ

1.1. Типология нарушений в научных публикациях

1.1.1. Нарушение требований к лексике научного текста

1.1.2. Нарушение структуры научного текста

1.1.3. Нарушение правил согласования

1.1.4. Нарушение синтаксической и семантической связности

1.1.5. Лексическая избыточность

1.1.6. Нарушение последовательности изложения

1.2. Методы автоматического анализа качества научных текстов


1.3. Основные выводы и постановка задачи
Глава 2. МЕТОДЫ ВЫДЕЛЕНИЯ ПРИЗНАКОВ, ХАРАКТЕРИЗУЮЩИХ КАЧЕСТВО ТЕКСТОВ НАУЧНОЙ СФЕРЫ
2.1. Выделение устойчивых общенаучных словосочетаний
2.1.1. Словари общенаучной лексики
2.1.2. Установление синтаксических и семантических связей
2.1.3. Формирование общенаучного словаря устойчивых
словосочетаний
2.1.4. Анализ встречаемости единиц словаря в текстах научной сферы
2.2. Выявление структурных разделов в научной публикации
2.2.1. Выделение разделов формата 1М11АЕ)
2.2.2. Выделение и структурирование списка литературы
2.3. Обнаружение лингвистических ошибок в научных текстах
2.3.1. Описание метода обнаружения лингвистических ошибок
2.3.2. Обнаружение нарушений правил согласования
2.3.3. Обнаружение нарушений синтаксической и семантической
связности
2.3.4. Обнаружение лексической избыточности
2.3.5. Обнаружение нарушений последовательности изложения

2.3.6. Результаты применения метода автоматического обнаружения лингвистических ошибок
Результаты главы
Глава 3. ПРИМЕНЕНИЕ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ ДЛЯ
ВЫЯВЛЕНИЯ ПРИЗНАКОВ ПСЕВДОНАУЧНЫХ ТЕКСТОВ
ЗЛ. Определение псевдонауки
3.2. Обнаружение псевдонаучных фрагментов
3.2.1. Описание метода обнаружения псевдонаучных фрагментов.
3.2.2. Экспериментальная проверка метода обнаружения псевдонаучных фрагментов
3.3. Формирование признакового пространства для обнаружения псевдонаучных текстов
3.4. Построение множества критериев принадлежности текста множеству псевдонаучных текстов
3.5. Сравнительный анализ эффективных методов классификации
Результаты главы
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ

ВВЕДЕНИЕ
Актуальность темы исследования. В открытой научной печати регулярно появляются тексты, которые не прошли должную проверку перед изданием. Они не соответствуют требованиям, предъявляемым к научным публикациям, содержат различные нарушения или вовсе являются псевдонаучными. Такие тексты встречаются в научных журналах (обычно не рецензируемых), в материалах конференций и в других источниках научной сферы (под источниками научной сферы понимаются издания открытой печати и информационные ресурсы, которые позиционируют себя как научные). В большинстве случаев нарушения приводят к снижению ясности изложения, что вводит в заблуждение как исследователей, которые знакомятся с новой для них научной областью, так и аналитиков, работающих с большими объемами данных, у которых нет возможности рассматривать каждый текст детально. Существующие методы автоматического анализа текстов не ориентированы на проверку качества анализируемых текстов. Они позволяют выполнять поиск релевантных запросу публикаций, структурировать данные, извлекать полезную информацию, однако отсутствие этапа, на котором определяется надежность источника и возможность использования содержащейся в нем информации, часто приводит к некорректным, необъективным результатам. В связи с этим требуется разработка методов и программных средств автоматического определения признаков, характеризующих качество текстов научной сферы, и выявления псевдонаучных текстов. Под качеством понимается совокупность характеристик, включающих оценку лексики и множества синтактико-семантических структур текста, оценку наличия лингвистических ошибок, оценку наличия псевдонаучных фрагментов, оценку формальной структуры текста, т. е. наличия в тексте необходимых разделов (например, описания результатов). Настоящая работа посвящена созданию методов интеллектуального анализа текстов, направленных на решение указанных задач, что свидетельствует о ее актуальности.

Рассмотрим разработанный в рамках настоящей работы метод автоматического формирования общенаучного словаря словосочетаний.
2.1.3. Формирование общенаучного словаря устойчивых
словосочетаний
Пусть 5+ и >5Г - множества предложений научных и ненаучных текстов,
таких что |. Требуется построить словарь словосочетаний IV, в
большей степени характерных для предложений множества 5+. Предлагается следующая последовательность шагов.
Алгоритм 2.1 (алгоритм формирования общенаучного словаря устойчивых словосочетаний).
Шаг 1. Задать множества ={0} и 1У~={0} - множества словосочетаний, входящих в предложения множеств 5^ и 5^ соответственно.
Шаг 2. Выполнить синтактико-семантический разбор каждого предложения множества 5^, расширяя множество IV* словосочетаниями с синтаксическими и семантическими связями.
Шаг 3. Для каждого встретившегося словосочетания уг,- (/ = 1,|й^+|)
подсчитать количество его вхождений 77, в множество предложений £+ и определить значение функции и+(уу) в точке уг,- так, что п+(V,•)=«,•. Пусть п+(уу)=0 для словосочетаний \> й IV+ .
Шаг 4. Выполнить синтактико-семантический разбор каждого предложения множества 5^, расширяя множество IV словосочетаниями с синтаксическими и семантическими связями.
Шаг 5. Для каждого встретившегося словосочетания уу,- (у = 1,|^~|)
подсчитать количество его вхождений Ш] в множество предложений 5" и определить значение функции п (м) в точке уVj так, что п (М])=ту Пусть п (иг)=0 для словосочетаний уг^й^-.

Рекомендуемые диссертации данного раздела

Время генерации: 0.115, запросов: 967