Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Ханжин, Анатолий Григорьевич
05.13.17
Кандидатская
1998
Москва
97 с. : ил.
Стоимость:
499 руб.
ОГЛАВЛЕНИЕ
Введение
§ 1. Гносеологический анализ знания о координатном индексировании документов
§ 2. Методологические вопросы разработки теории координатного индексирования документов
§ 3. Понятие темы и процесс её формирования
§ 4. Типы заглавий и их структуры
§ 5. Понятие ключевого слова и его свойства
§ 6. Особенности и структура поисковых образов документов
Заключение
Список литературы
Приложения
1. Список сокращений
2. Словарь терминов
3. Методика координатного индексирования документов
4. Список лексических категорий
ВВЕДЕНИЕ
Создание большого числа автоматизированных информационно-поисковых систем (ИПС) привело к широкому применению координатного индексирования документов (КИД). Однако применение дорогостоящей техники и привлечение значительного числа индексаторов в таких системах не могли не вызвать вопросы повышения эффективности их функционирования, в частности, эффективности КИД. Поэтому вполне естественно предположить, что расширение сферы применения КИД приведет к интенсивному исследованию этого процесса.
&кты же свидетельствуют, что информатика уже в начале своего развития уделяла большее внимание автоматизации КИД, нежели теоретическому изучению глубинной сущности этого процесса. Отсутствие же теоретического фундамента КИД привело к тому, что до сих пор оно осуществляется интуитивным путем и без необходимой индексаторам научно обоснованной методики.
В настоящее время КИД чаще осуществляется по правилам, приведенным в документе, выдаваемом индексаторам и называемом обычно инструкцией. В ней приводятся рекомендации по выявлению ключевых слов (КС), правила выбора лексических форм КС, правила формирования поискового образа документа (ПОД) и т.д. При этом для нахождения КС в индексируемом документе индексатор может воспользоваться лишь такими признаками, как: КС
"слова и словосочетания документа, существенные для описания содержания документа", или "КС можно найти в таких фрагментах
текста, как: заглавие, введение, заключение,
искать по такой рекомендации слова, существенные для описания содержания документа, например, во введении, то у индексатора непременно возникнет вопрос: является ли данное слово сущест-
венным. Поскольку других конкретных признаков, по которым он мог бы решать свою задачу, в таких инструкциях нет, то ему остается выбирать КС, полагаясь лишь на свою интуицию. Ясно, что если так осуществлять КИД, то в ПОД могут войти ненужные для поиска слова в качестве КС, а нужные КС - отсутствовать. Но это, как известно, приводит к снижению эффективности функционирования ИПС. Сказанное означает, что в информатике, а точнее в познании КИД существует проблема
Актуальность работы определяется тем,что в настоящее время нет ни надежной теории КИД, на основе которой можно было бы разрабатывать методику КИД, ни самой методики, позволяющей целенаправленно выбирать КС и компоновать ПОД. Если учесть, что сфера применения КИД расширяется, а требования к качеству индексирования все больше повышаются, то решение этой проблемы становится важным делом для информатики. Исходя из сказанного, в настоящей диссертационной работе формулируется следующая цель.
Целью настоящей диссертационной работы являются разработка теоретических основ КИД, позволяющих расширить и углубить знания о КИД (в частности, выявить признаки и свойства Ж)), и разработка методики КИД с использованием полученных знаний.
ОСНОВНЫЕ ЗАДАЧИ РАБОТЫ.
Сформулированная выше цель достигается в настоящей работе решением следующих задач:
1) гносеологический анализ научных работ, в которых приведены существенные результаты исследований КИД;
2) методологическое обоснование выбора формы и содержания теории КИД;
3) уточнение природы и понятия темы;
щениях о таких необьяененных явлениях их базисы в утвердительной форме не упоминаются, а в заглавиях таких сообщений приводится предметное слово, относящееся к категории явлений, и не упоминается его базис. Примером такого заглавия является:
1г. Наблюдение1 (полярного сияния)/7 в (средних широтах/''
России
Перейдем к рассмотрению заглавий второго типа. Этот тип характеризуется тем, что предметное слово принадлежит к категории процессов (действий, операций, методов, способов). В этом случае после предметного слова приводятся обычно два слова, обозначающих те вещи, которые участвуют в данном процессе , например:
• _ п О
2. Окисление железа в воздухе
2а. Обработка (зубчатого колеса) (червячной фрезой)
26. (Автоматическое считывание)П текста сканером0?
Нужно иметь в виду, что в практике наблюдаются случаи, когда какое-либо опорное слово опускается. Это бывает, когда упоминание процесса делает необязательным включение какого-либо опорного слова из-за его тривиальности. Так, если речь идет об окислении, то слова "кислород” и "воздух" могут быть опущены.
К третьему типу относятся заглавия, предметы которых принадлежат к категории отношений. В заглавиях этого типа приводятся слово, обозначающее отношение (его называют иногда ре-лятором), и слова-корреляты, связанные этим отношением. В качестве реляторов часто используют такие слова, как "применение" (использование), "влияние", " зависимость". Поскольку релятор и два его коррелята в таких заглавиях имеют важное значение для понимания содержания документа, то все они
Название работы | Автор | Дата защиты |
---|---|---|
Методы распознавания изображения лица человека по цветовым признакам и идентификации личности на основе скрытых марковских моделей в системах видеонаблюдения | Двойной, Илья Ростиславович | 2013 |
Программно-технологический комплекс для развития информационной среды образовательного учреждения на основе системы электронного документооборота | Гудов, Александр Михайлович | 2013 |
Вероятностно-комбинаторный формальный метод обучения, основанный на теории решеток | Виноградов, Дмитрий Вячеславович | 2018 |