Построение семантического словаря для обработки англоязычных текстов

Построение семантического словаря для обработки англоязычных текстов

Автор: Кутарба, Анна Юрьевна

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2006

Место защиты: Санкт-Петербург

Количество страниц: 129 с. ил.

Артикул: 2935619

Автор: Кутарба, Анна Юрьевна

Стоимость: 250 руб.

Построение семантического словаря для обработки англоязычных текстов  Построение семантического словаря для обработки англоязычных текстов 

1. Обоснование и выбор метода формализации ЕЯ, допускающего эффективное использование в компьютерных системах.
2. Построение семантического словаря для обработки англоязычных текстов.
3. Выбор разработка методов автоматического поиска, диалога и рубрицирования информации в тексте на английском языке.
В результате исследования была показана возможность адекватного отображения множества английских слов на множество семантических классов русского языка. На основе полученных результатов был создан семантический словарь для обрботки англоязычных текстов и разработаны методы автоматического поиска, диалога и рубрикации релевантной информации, которые могут быть использованы в управление документооборотом, в работе почтовых систем, обучающих программах, автоматизации получения информации из архивов и библиотек и т.д.
Структурно работа подразделяется па введение, три главы и заключение, сопровождается 3мя приложениями.
Введение


В частности, можно выделить поисковые системы, вопросноответные системы, системы построения рубрик, системы автоматизированного машинного перевода и т. В настоящей работе основой всех методов обработки текстов на ЕЯ является семантическая модель естественного языка, разработанная профессором факультета Прикладной математики Процессов управления д. Тузовым В. Работа относится к области междисциплинарных исследований. Для получения логически завершенного результата исследование включает ряд частных задач обзор и обоснование выбора метода формализованного представления ЕЯ, разработка методов поиска релевантной информации в текстах на ЕЯ. Для решения частных задач исследования используется математический аппарат теории формальных грамматик, теории множеств и реляционной алгебры. Основным объектом исследования в работе является текст на естественном языке. Под текстом на естественном языке понимается цепочка символов. Способ получения этой цепочки значения не имеет будь это текст, набранный на компьютере, отсканированный с твердого носителя или полученный посредством устройства речевого ввода. Следует сделать особые замечания об источниках информации, использованных в работе. Часть их составляют материалы из сети Шете и работы, являющиеся объектами интеллектуальной собственности. Источники первого рода не допускают прямые ссылки в силу динамичности информации, располагаемой на страницах, а поиск в архивах сайта не всегда приводит к результату. Источники второго рода не имеют широкого распространения. Поэтому некоторые ссылки, приводимые в работе, имеют целью не столько указание на дополнительный источник информации, сколько отделение суждений автора от заимствований. Глава 1. Опыт формализации ЕЯ. Универсальный язык Ньютона. Работа великого английского ученого И. Ныотона Об универсальном языке представляется вполне закономерной и соответствующей тому времени попыткой выделить универсальное начало в естественных языках. Ньютон обосновывал языковую общность тем, что языки, по его мнению, были созданы для обозначения субстанций духов или тел, которые
у всех народов одинаковы. Слова же, обозначающие отношения или предикаты, описываются через главного своего представителя основного действующего лица, субъекта предиката. О корнях универсального языка Ньютон говорит лишь то, что каждый из них должен начинаться с буквы, которая относит этот корень к какойто одной субстанции типу. Например, должна быть специальная буква для обозначения видов людей, ангелов, домов и т. Но полный перечень субстанций не дается. Большая часть работы посвящена тому, что мы сейчас бы назвали семантикой морфологии или просто грамматикой языка. Ньютон перечисляет все 1рамматические префиксы и аффиксы, объясняя попутно их использование. Начинается все с категории степени, в которой выделяется значений, каждое из которых призвано обозначить некоторую позицию в оценочных шкалах типа плохойхороший, большоймаленький и т. Vi V. В других работах шкалы играют более значительную роль. При описании типов предикатов и отношений Ныотон на самом деле перечисляет тс отношения, которые могут связывать участника ситуации с ситуацией, т. К сожалению, в работе приведен один единственный пример с глаголом рисовать точнее, с субъектом рисования художником, что не позволяег достоверно спроектировать ньютоновские падежи на какуюнибудь из современных систем. Отмстим только, что помимо общепринятых основных отношений СУБЪЕКТ, ОБЪЕКТ, АДРЕСАТ, РЕЗУЛЬТАТ и т. Например, есть специальная роль, связывающая участника с ситуацией, когда он действует в общем предикате наравне с основным субъектом. Надо полагать, что два равных субъекта усматриваются, например во фразе Я с другом иду в кино. Необходимость этих дублей не совсем понятна, хотя в некоторых современных системах см. Категория времени в работе Об универсальном языке разработана очень детально. Сравнивается положение первой точки со второй и второй с третьей. В первом случае выделяется два полюса бесконечно давно и по прошествии бесконечности, между которыми в центре стоит настоящее время первая точка. Между каждым полюсом и центром настоящее время еще пять позиций.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.211, запросов: 244