Ранговые распределения как инструментальный критерий при формировании документных массивов информационных систем и баз данных

Ранговые распределения как инструментальный критерий при формировании документных массивов информационных систем и баз данных

Автор: Либкинд, Александр Наумович

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2004

Место защиты: Москва

Количество страниц: 145 с. ил.

Артикул: 3299135

Автор: Либкинд, Александр Наумович

Стоимость: 250 руб.

Ранговые распределения как инструментальный критерий при формировании документных массивов информационных систем и баз данных  Ранговые распределения как инструментальный критерий при формировании документных массивов информационных систем и баз данных 

Оглавление
Ведение.
Глава 1. Методы изучения документальных полей.
1.1. Меристический и холистический подходы в информатике к изучению
документов сходство и различие.
1.2. От классификации документов к ранговому распределению
1.3. Математические модели ранговых распределений
1.4. Интерпретация ранговых распределений меристический подход
1.5. Интерпретация ранговых распределений холистический подход.
1.6. Закон Ципфа как теоретическая модель рангового распределения.
Глава 2. Методы оценки исследуемых документных массивов. Проблема
создания отечественного указателя научного цитирования.
2.1. Подмножество представительных документов. Инструменты
выделения представительного подмножества и их оценка реферативное издание и массив научных документов, поступающих в крупный
научный фонд.
2.2. Оценка авторитетности РЖ ВИНИТИ. Первый способ.
2.3. Оценка авторитетности РЖ ВИНИТИ. Второй и третий способы.
2.4. Оценка авторитетности массива научных публикаций,
поступающих в крупный научный фонд
2.5. Принципы и реализация создания отечественного указателя научного
цитирования .
2.6. Общие характеристики ДП по энергетическому машиностроению.
Документы из НИИ основа для формирования представительного
множества .
Глава 3. Математическая модель замкнутого информационного поля ЗИП.
3.1. Дискретный аналог закона Ципфа модель ЗИП
3.2. Эмпирический материал и его представление .
3.3. Способы проверки закона Ципфа .
3.4. Диаграммы разброса уЛ. Объемы ПИИ и отклонение реальных
РР от модели в области малых рангов
3.5. Тематическая замкнутость ДП. Замкнутость по цитированию
как критерий ЗИП.
3.6. Интернациональный и региональный характер ДП.
3.7. Хронологические рамки ЗИП.
Глава 4. Процесс изменения продуктивности источников для данного фрагмента ДП .
4.1. Построение модели.
4.2. Сопоставление выводов теории с данными экспериментаПО
4.3. Границы применимости модели. Возможность предсказания изменения для всего списка источников по тематике.
Поток через границу важная характеристика ДП
Заключение .
Список использованной литературы


Однако когда речь заходит о теоретическом исследовании научных документов, преобладает меристический подход. Этот подход предполагает, что документ любой тематики обладает некоторыми усредненными качествами, которые обязательно проявятся, если рассматриваемая совокупность документов будет достаточно обширной и однородной (статистическая однородность обычно предполагается как нечто само собой разумеющееся). М) Любая совокупность документов ? Так дело обстоит в принципе. Но на практике и в рамках меристического подхода исследуются, прежде всего, высоко-интегрированные тематики, так как именно они и интересуют информационных работников. В этих исследованиях были обнаружены, в частности, интересные свойства ранговых распределений изученных массивов документов (эти особенности будут обсуждаться в § 1. Но эти результаты оказались плохо воспроизводимыми: данные, полученные одним исследователем на одном массиве документов не подтверждались на массиве, обработанном другим исследователем (ср. Информатика4' в шести работах разных авторов [, 8, 5, 4, 1, 9]). В рамках - холистического подхода естественно задать вопрос, имели ли эти исследователи дело с объектами одной природы, или обработанные ими массивы относились к тематикам с принципиально разной степенью интеграции. Периоду интеграции тематики (которая не редко происходит на каком-то ограниченном ареале) могут противостоять периоды, когда круг вопросов её образующих, не отличался особой связностью. Примером этому может служить история самой информатики, которая объединила внутри одной тематики традиционно самостоятельные дисциплины или их разделы: библиотековедение, библиография, книговедение, специальные разделы лингвистики, психологии и т. X) Тематика - вся совокупность документов, отражающих такую предметную область, которая на определенном этапе своего развития (и в определенных пространственных границах) обнаруживает высокую степень интеграции. Вопрос о том, как документы отражают данную тематику, сводится к вопросу, что в организации ДП связано с исторически сложившимися особенностями системы научных коммуникаций, а что - обусловлено самой структурой соответствующей предметной области. Для науковеда эти вопросы важны, чтобы знать, что учесть и от чего отвлечься, рассматривая структуру знания через посредство научных документов. Но для специалиста по информатике выявление тех "искажений", которые вносит система научных документов, -одна из основных целей исследования. Мернстическая точка зрения на представительность собрания документов для данной тематики очень проста: изучение тематики (конечно в меристическом смысле этого термина) может быть сведено к изучению документальных информационных потоков. М) Документальный информационный поток (ДИП) - случайная выборка достаточного объема из множества документов данной тематики. Какой объем выборки считать достаточным, определяет закон больших чисел и заданная точность исследования. Конечно, изложенная выше мернстическая точка зрения, - это не реальная исследовательская программа, воплощенная в конкретных работах, а только некоторый идеал, определяющий их ориентацию. Дело не только в том, что чрезвычайно сложно организовать случайную выборку документов, но и в том, что исследователи-практики интуитивно ощущают что, чрезмерно приблизившись к этому теоретическому идеалу, можно получить вполне бессмысленный результат. Практически все исследователи согласны, что, отбирая множество представительных для данной тематики документов, следует учитывать их различную функцию в процессе научной коммуникации и разницу в их статусе (см. Дело в том, что анализ ДП включает простейшую, но очень важную операцию - подсчет числа документов, попавших в одну ячейку классификации. Полученное число не будет иметь никакого смысла, если об этом не позаботиться специально: нельзя утверждать, что в ячейке два документа, если там находится статья и реферат этой статьи, нельзя "складывать" оригинальное исследование и учебное пособие, работу, содержащую новые результаты, и работу', излагающую основы классической теории (хотя для функционирования Науки важны все жанры).

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.298, запросов: 228