+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Методы и средства управления научной информацией с использованием онтологий

Методы и средства управления научной информацией с использованием онтологий
  • Автор:

    Голомазов, Денис Дмитриевич

  • Шифр специальности:

    05.13.17

  • Научная степень:

    Кандидатская

  • Год защиты:

    2012

  • Место защиты:

    Москва

  • Количество страниц:

    188 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"
1	Учет и анализ научной информации 
1.2	Методы и средства управления научной информацией


Оглавление
Введение

1 Учет и анализ научной информации

1.1 Постановка задачи

1.2 Методы и средства управления научной информацией

1.3 Системы управления научной информацией

1.3.1 Крупные всб-сервисы

1.3.2 Зарубежные исследовательские проекты

1.3.3 Российские семантические системы


1.4 Выводы

2 Архитектура системы учета и анализа научной информации


2.1 Онтологический подход к представлению знаний
2.2 Модель и архитектура системы учета и анализа научной информации
2.3 Выделение терминов, характеризующих область знания
2.4 Построение онтологии области научного знания
2.5 Загрузка данных в систему
2.6 Установление связей между загруженными данными и онтологией области научного знания
2.7 Выполнение аналитических запросов к данным
2.8 Выводы
3 Алгоритмы выделения терминов и построения онтологии области знания
3.1 Алгоритм Втатвтт выделения терминов из коллекции текстов с заданным тематическим делением
3.1.1 Математическая модель
3.1.2 Пространственный критерий
3.1.3 Критерий частотности
3.1.4 Критерий характерности
3.1.5 Критерий значимых рубрик
3.2 Алгоритм Боптаке построения онтологии области научного знания

3.2.1 Построение множества имен понятий
3.2.2 Выделение терминов
3.2.3 Фильтрация терминов
3.2.4 Выявление ассоциативных отношений
3.2.5 Построение иерархии терминов
3.2.G Перевод терминов на русский язык
3.2.7 Разбиение терминов на категории
3.3 Выводы
4 Программная реализация и анализ эффективности базовых алгоритмов
4.1 Программная реализация и исследование эффективности алгоритма выделения
терминов Brainsterm
4.1.1 Методика оценки эффективности
4.1.2 Результаты тестирования
4.1.3 Выводы
4.2 Программная реализация и исследование эффективности алгоритма построения
онтологии Sonmake
4.2.1 Выводы
4.3 Выводы
5 Программная система учета и анализа научной информации ИСТИНА
5.1 Особенности программной реализации
5.2 Результаты практической апробации
5.3 Соответствие прототипа системы предъявляемым требованиям
5.4 Дальнейшее развитие
5.5 Выводы
Заключение
Список использованных источников
Приложения
A. Требования к качеству программной системы управления научной информацией . 155 Б. Описание сервиса WikiCFP
B. Выделение информации из неструктурированных текстов
Г. Использование онтологий для выделения информации
Д. Описание языка SPARQL
Е. Описание используемых алгоритмов
Ж. Политика информационной безопасности в системе ИСТИНА

Введение
Актуальность
Для улучшения работы научных организаций и, как следствие, повышения эффективности развития науки в масштабах государства необходимо перманентно анализировать информацию о результатах деятельности отдельных ученых и коллективов исследователей. Основными результатами деятельности организаций, входящих в научное сообщество, как правило, считаются публикации сотрудников, результаты патентных исследований, участие в конференциях, руководство курсовыми, дипломными и диссертационными работами, чтение лекций и ряд других. При этом, как показывает практика, далеко не все результаты такой деятельности представлены в открытом доступе в Интернет. Зачастую единственным источником подобной информации могут служить лить годовые отчеты сотрудников научных организаций, представленные с той или иной степенью подробности. Естественным образом возникает необходимость автоматизированной (с участием человека) обработки данных из подобных научных отчетов в целях количественного и качественного анализа эффективности научной деятельности отдельного коллектива, вклада каждого его участника и возможной корректировки планов, мер и мероприятий на основе такого анализа. Целями проведения анализа могут быть следующие.
• Сравнение данных о работе подразделения с данными других подразделений, в том числе - зарубежных, которые работают на рассматриваемом направлении.
• Интеграция данных о работе подразделения с данными других подразделений в целях анализа развития науки в рамках структур корпоративного масштаба и по стране в целом.
• Корректировка финансирования подразделений, поощрения отдельных их членов на основе результатов научных достижений.
• Публикация обзорных аналитических статей, посвященных научным достижениям организации.
• Получение интегрированной информации о направлении исследований в отдельной области знания, например, список основных публикаций, задач, методов, уровень активности ученых, ключевые персоны и конференции на этом направлении.
Такая информация может представлять интерес для исследователя, которому необходимо получить первое, общее представление о еще недостаточно знакомом научном направлении.

• Сложность и малые возможности поиска информации.
В запросе необходимо задавать тематику объектов (например, публикаций), которые нужно найти. Тематика публикации может находиться на стыке нескольких направлений одной области знаний и описываться несколькими ключевыми фразами, а не одной. Целью настоящей диссертации является создание системы, способной обрабатывать запрос, заданный произвольным набором ключевых фраз на естественном языке. Это усложняет выполнение запроса и переносит часть алгоритмической сложности с процесса загрузки данных на процесс выполнения запроса, повышая, тем самым, гибкость системы.
• Использование жестких и малоинформативных моделей области знания, нехватка гибкости систем.
Предметные области в современных программных комплексах, как правило, задаются заранее и вручную. Это связано с несколькими проблемными вопросами, главными из которых являются необходимость задействовать большой объем человеческих ресурсов, а также необходимость постоянного ручного обновления модели.
• Направленность на обработку информации из Интернет, а не на полуавтоматический ввод пользователем.
Как было отмечено ранее, далеко не вся информация, содержащаяся в научных отчетах, находится в Интернет в открытом доступе. Не весь объем такой информации индексируется веб-сервисами. Это обстоятельство ограничивает их применимость для рассматриваемой задачи.
• Ориентация на распределенный характер хранения и доступа к данным и недостаточное внимание к интеллектуализации алгоритмов загрузки, обработки и поиска информации. Использование онтологий позволяет сравнительно легко перейти от централизованной к распределенной модели хранения и доступа к данным. Вместе с тем, в настоящей диссертации основной акцент делается не на распределенный характер информации, а на интеллектуализацию алгоритмов ее загрузки, обработки, поиска и анализа.
В заключение необходимо отметить следующие два обстоятельства. Во-первых, программный комплекс, выступающий в качестве целевого в настоящей работе, с успехом может применяться во взаимодействии с другими системами, которые представлены выше, использовать отдельные их компоненты или информационные активы. Во-вторых, изложенные в главе 1 результаты исследования методов, средств и систем управления научной информацией, как предметной областью, позволяют системно представить эту область. Это создает исходные посылки:
• для формирования подлежащего разработке комплекса, автоматизирующего технологические процессы в области поиска и хранения, систематизации и анализа данных о научной деятельности;
• для построения общей формальной модели такого автоматизированного комплекса в целом и более детальных моделей отдельных составляющих его компонент.

Рекомендуемые диссертации данного раздела

Время генерации: 0.131, запросов: 967