Метод синтактико-семантических шаблонов и его применение в информационной технологии интерпретации текстов

Метод синтактико-семантических шаблонов и его применение в информационной технологии интерпретации текстов

Автор: Чубинидзе, Константин Александрович

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Москва

Количество страниц: 156 с. ил.

Артикул: 3309343

Автор: Чубинидзе, Константин Александрович

Стоимость: 250 руб.

1.1. Интерпретация и формы представления се результатов.
1.2. Существующие системы автоматической Формализации текстов
1.3. Оценка качества систем автоматической интерпретации.
Глава II. Применение шаблонов для формализации текстовой информации
2.1. Метолы автоматического формирования шаблонов идентификации сущностей и событий
2.2. Структура синтактикосемаитического шаблона интерпретации.
2.3. Человекомашинная технология формирования и применения синтактикосемантических шаблонов.
Глава III. Алгоритмы метола синтактикосемантических шаблонов
3.1. Формирование граба синтакгикоссмантических отношений.
3.2. Автоматизированное создание шаблона интерпретации.
3.3. Уровни обобщения лингвистических характеристик
3.4. Оптимизация набора синтактикоссмантичсских шаблонов
3.5. Автоматизированная интерпретация предложения.
Глава IV. Макет системы автоматизированной интерпретации и
результаты его опытной эксплуатации.
4.1. Формальный язык описания предметом области.
4.2. Структура информационных объектов
4.3. Функции интерфейса пользователя
4.4. Результаты опышой эксплуатации и пути совершенствования метола
Заключение
Библиографический список
Введение


Формальная процедура 5 заключается в окончательной обработке и сохранении выражения на формальном языке. Работу оператора, выполняющего неформализованную семантическую часть интерпретации в человекомашинной системе всегда сопровождают предварительные и заключительные формальные процедуры см. Таблицу 1. Таблица 1. Ь ГЬ. Незначительные различия между IйI и компенсируются в процессе формализации, таким образом формальное описание абстрактного состояния предметной области при интерпретации текста может быть таким же как и при интерпретации результатов компьютерного лингвистического анализа, то есть А ТУкУтЬ. Работа человекомашинной системы интерпретации не с текстом на естественном языке, а с результатами его компьютерного лингвистического анализа характеризуется тем, что оператор получает и генерирует выражения на формальных языках, то есть работает как формальный аппарат, или черный ящик. Результаты анализа поступающей к оператору и формируемой им информации позволяют моделировать его работу и за счет этого увеличивать производительность системы см. Рис. Рис. Человекомашинная система интерпретации Формирование выражения на формальном языке, описывающем абстрактное состояние предметной области заключается в предварительной формализации высказывания на естественном языке, которое выполняет компьютер V. Если компьютер способен выполнить преобразование в А, то интерпретация выполняется автоматически в противном случае оператором . Заключительные процедуры , выполняемые компьютером, заключаются в верификации и сохранении результатов интерпретации, а также в самообучении человекомашинной системы. Проблема реализации описанного подхода заключается в том, что язык описания результатов компьютерного лингвистического анализа формализован частично, при этом увеличение его формализации приводит к увеличению расхождений между и . Таким образом, следует комплексно оптимизировать компьютерный лингвистический анализ и формализованный язык описания его результатов в соответствии с когнитивными возможностями человека и формальными языками, используемыми для описания абстрактных состояний предметных областей интерпретации. Ыа практике применяемые методы компьютерного лингвистического анализа определяются той формой, в которую должна быть преобразована содержащаяся в тексте информация. Выделение ключевых слов заключается в формировании списка лексических единиц, наиболее соответствующих содержанию текса. Этот способ представления содержащейся в тексте информации долгое время доминировал не только при анализе текстов средствами вычислительной техники, но и при создании тематических каталогов в библиотеках. В первую очередь, ключевые слова применялись для поиска документов и для статистического анализа их содержания. До недавнего времени существовало два метода выделения ключевых слов статистический и лингвистический. В наиболее развитых системах использовалось сочетание этих двух методов. В настоящее время, в условиях лавинообразного роста количества обрабатываемых документов такая форма представления содержащейся в них информации оказалась малоэффективной. При поиске документов это объясняется тем, что форма представления информационной потребности в форме объединенных в логическую формулу лексических единиц затрудняет вычисление релевантности найденных документов, в результате чего, поисковая система находит настолько большое количество формально релевантных документов, при котором задача поиска остается нерешенной. Другой причиной является полисемия естественных языков, то есть взятое в отдельности слово может иметь несколько семантических значений, конкретизация которых осуществляется по контексту, который в данном случае утрачивается. Эта же причина ставит под сомнение эффективность использование наборов ключевых слов для статистического анализа информации, содержащейся в документах. Выделение семантических понятий. В условиях значительного удешевления вычислительных ресурсов появилась возможность считать ключевыми все значимые слова в тексте на естественном языке, что привело к появлению полнотекстовых поисковых и аналитических систем.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.189, запросов: 228