Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки

Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки

Автор: Сбойчаков, Константин Олегович

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2003

Место защиты: Москва

Количество страниц: 169 с. ил.

Артикул: 2625254

Автор: Сбойчаков, Константин Олегович

Стоимость: 250 руб.

ОГЛАВЛЕНИЕ
Введение
Глава 1. Автоматизированная система смысловой обработки текстов
1.1. Обзор существующих программных продуктов анализа текстов
1.2. Смысловая обработка текстов в полнотекстовых базах данных
1.3. Описание работы системы автоматизированного смыслового анализа текстов
Глава 2. Система визуального эвристического кластерного анализа
2.1. Экспертные системы и система визуального эвристического анализа сходства и отличия.
2.2. Возможности системы Vi ГСА
Vi ii i.
2.3. Методы, ориентированные на данные
2.4. Примеры применения.
Глава 3. Описание работы алгоритмов смысловой обработки текстов
3.1. Алгоритм отбора слов в естественно тематический словарь
3.2. Алгоритм разбиения основного естественнотематического словаря на ряд предметноориентированных словарей
3.3. Алгоритм создания естественнотематичсского классификатора.
3.4. Сравнение текстов в алгоритме смыслового анализа.
3.5. Алгоритм расчета близости текстов заданному текстуобразцу.
Глава 4. Перспективы развития ИРБИС в плане применения системы смыслового анализа текстов для создания полнотекстовых баз данных в современной библиотеке.
4.1. Автоматизированная библиотечная система ИРБИС в ГПНТБ России
4.2. Разница между системой смыслового анализа для ИРБИС
и ИРБИС.
4.3. Подготовка специалистов библиотеки для работы с системой
4.4. Последовательность операций при создании и ведении базы данных ИРБИС при использовании системы смыслового
анализа текстов.
4.5. Система смыслового анализа текстов в ИНТЕРНЕТ
Заключение
Приложение. Эвристика образного анализа.
1. Пояснения работы системы визуального эвристического
анализа Vi НСЛ.
2. Иллюстрации возможностей программы на сформированных модельных данных.
Список использованной литературы


Решение тех же задач традиционными методами требовал нескольких месяцев работы и не всегда позволял выявить тс же закономерности в предметной области. Визуальный трехмерный анализ временных измерений на плоскости (Visual НСЛ 3D)’’, которая используется в учебном процессе Российской академии государственной службы при Президенте Российской Федерации (акт о внедрении прилагается). Апробация результатов исследований состояла в публикации материалов исследований в отечественных и зарубежных периодических изданиях, в выступлениях с докладами па отечественных и зарубежных конференциях и опубликовании текстов этих докладов. Крым ”, “Крым ”, “Крым 2”, “Крым ” “Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества” (г. Судак, Украина, Автономная республика Крым). ЛИБКОМ ”, “ЛИБКОМ ”, “ЛИБКОМ ” "Информационные технологии, компьютерные системы и издательская продукция для библиотек" (Ершово, Московская область). Иссык-Куль ” “Библиотеки и демократизация общества: библиотечно-информационное обслуживание в век информатизации” (г. Чолпан-Ата, Кыргызстан). ГЛАВА 1. В настоящее время на коммерческом рынке разработка отдельных продуктов для полнотекстового анализа признана невыгодным шагом. Поэтому фирмы стараются развивать алгоритмы текстового анализа как расширения для серверов баз данных. В России существует ряд систем текстового анализа для поддержки работы специалистов с большими объемами текстовой информации. Принципы работы этих систем в основном статистические с дополнительной лингвистической поддержкой. Кроме известных поисковых серверов можно назвать системы “ТекстАналист” [0] и “Следопыт “(Media Lingva) [6]. В данном обзоре приводятся описания наиболее продвинутых систем, представленных сегодня на IT рынке России. Существует большое количество систем, разработанных в основном специалистами университетских центров и используемых для своих нужд. В данном обзоре они не описываются, так как принципы работы системы смыслового анализа текстов сходны и опираются на научный потенциал разработчиков, накопленный ранее. В список не включены системы анализа текстов, разработанные для больших поисковых серверов, таких как Яндекс, OZON, Rambler и т. В основном это комплексы, настроенные па работу в Интернете. Исключение в списке программных продуктов представляет система “Ключи от тскста”[], не являющаяся в строгом смысле слова конкурентно способным IT товаром, но по принципу работы наиболее близко подходящей к системе смыслового анализа. Адаптацией технологии Oracle к русскоязычным полнотекстовым базам данных занимаются специалисты компании «Гарант-Парк-Интернет». Продукт этой компании под названием Russian Context Optimizer (RCO) предназначен для совместного использования с картриджем interMcdia Text []. Лидер мирового рынка СУБД Oracle уже снабдил разработчиков информационных систем рядом передовых технологий. Речь идет о картридже interMcdia Text, входящем в состав СУБД ORACLE8i, при использовании которого обработка текста сочетается со всеми возможностями, предоставленными пользователю Oracle для работы с реляционными базами данных. В частности, при написании приложений стало возможно использовать SQL с развитым языком запросов к полнотекстовой информации. Продукт позволяет расширить возможности Microsoft BackOffice (MS SharePoint Portal, MS Indexing Service, MS Exchange Server и MS SQL Server) при работе с текстами на русском языке, обеспечивая поиск с учетом всех грамматических форм слов на основе морфологического анализа. Серия продуктов, выпускаемых под маркой RCO™, предназначена для поддержки широкого класса систем, использующих средства поиска и анализа текстовой информации, таких, как информационно-поисковые и аналитические системы, электронные архивы и системы управления документооборотом. Продукты серии RCO задействуют передовые технологии обработки текста, лингвистические и математические алгоритмы, которые могут быть использованы для решения широкого класса задач: от контекстного поиска текстов с учетом всех словоформ, синонимов и опечаток до создания систем поддержки принятия экспертных решений на основе анализа информационных массивов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.208, запросов: 228