Концептуальный анализ текстов в системах автоматической обработки научно-технической информации

Концептуальный анализ текстов в системах автоматической обработки научно-технической информации

Автор: Козачук, Максим Вячеславович

Шифр специальности: 05.25.05

Научная степень: Кандидатская

Год защиты: 2002

Место защиты: Москва

Количество страниц: 199 с. ил

Артикул: 2608296

Автор: Козачук, Максим Вячеславович

Стоимость: 250 руб.

СОДЕРЖАНИЕ
Введение
Глава 1. Автоматический концептуальный анализ текстов.
Постановка задачи
Глава 2. Методы автоматического концептуального анализа текстов
2.1. Автоматический концептуальный анализ текстов с контролем
по тезаурусу
2.2. Составление частотных словарей наименований понятий на основе концептуального анализа текстов с контролем по тезаурусу
2.3. Автоматический концептуальный анализ текстов без контроля
по тезаурусу
2.4. Составление частотных словарей наименований понятий на основе концептуального анализа текстов без контроля по тезаурусу.
Глава 3. Применение методов автоматического концептуального анализа текстов в системе фразеологического машинного перевода НЕТКАН
3.1. Общая характеристика системы фразеологического машинного
перевода КЕТКАКБ
3.2. Словари пользователей в системе фразеологического машинного
перевода ШТКАЯЗ.
Глава 4. Применение методов автоматического концептуального анализа текстов в системах классификации и поиска информации
4.1. Автоматическая классификация текстов.
4.2. Поиск информации в русскоязычных базах данных по запросам, сформулированным на иностранных языках
Заключение
Литература


Г. Пиотровским в его книге []. В ней подробно описываются различные этапы “речемыслительного коммуникационного процесса” (стр. Взгляды автора на этот процесс далеко не бесспорны. Так, критикуя излишне формальный “алгебраический” подход к языку, господствовавший, но его мнению, на начальном этапе работ по машинному переводу, он нередко и сам использует такой же подход. Через два года после выхода в свет книги [] Р. Г. Пиотровский публикует статью [], в которой по существу подтверждает свои прежние позиции. Но если в книге [] он иногда делает оговорки, что ег о рассуждения следует рассматривать как более или менее достоверную гипотезу, то в статье [] он более категоричен. Менее категоричен в своих суждениях Л. Р. Лурия - автор монографии “Язык и сознание” [], посвященной проблеме отношения языка и сознания. На стр. Психология до сих пор еще не располагает достаточно точными знаниями о том, чем характеризуются отдельные этапы сложнейшего процесса порождения высказывания ”. А автор, по-видимому, знает свой предмет, так как его монография представляет собой изложение курса лекций, прочитанных им на факультете психологии Московского государственного университета. Подведем предварительные итоги. Мы будем исходить из того, что единицы языка и речи (языковые знаки) являются психическими сущностями, недоступными непосредственному человеческому наблюдению. Эти единицы представляют собой ассоциации двух психических образов - означающего и означаемого. Каждая из единиц в сознании человека связана ассоциативными отношениями со всеми другими единицами. В процессе речевого общения психические образы-означающие материализуются в виде акустических сигналов, порождаемых одним человеком, и воспринимаемых с помощью органов чувств другим человеком. При этом, по мнению Гумбольдта, “люди понимают друг друга не потому, что передают собеседнику знаки предметов, и даже не потому, что настраивают друг друга на точное и полное воспроизведение идентичного понятия, а потому, что взаимно затрагивают друг в друге одно и то же звено чувственных представлений и начатков внутренних понятий, прикасаются к одним и тем же клавишам инструмента своего духа, благодаря чему у каждого вспыхивают в сознании соответствующие, но не тождественные смыслы” ([], стр. В письменной речи психические образы-означающие отображаются в виде последовательностей букв алфавита или, для некоторых восточных языков, - в виде иероглифов. При этом, в случае буквенного представления текстов, границы слов, как правило, обозначаются пробелами. Поэтому выделение однословных наименований понятий из текстов не вызывает затруднений. Значительно сложнее дело обстоит со словосочетаниями, которые могут состоять из различного количества слов. Их границы формально не обозначены, а “отмечены” только в сознании человека. Как уже было указано, под концептуальным анализом текстов мы будем понимать процедуру выделения из их состава наименований понятий и определение синтагматических и парадигматических отношений между понятиями. В более узком смысле - только выделение наименований понятий из текстов (их расчленение на наименования понятий). При этом мы будем исходить из того, что в современных системах автоматической обработки и передачи текстовой информации мы имеем дело преимущественно с кодовыми представлениями означающих, а план содержания (означаемое и связанные с ним ассоциации) - в полной мере отображается только в сознании и подсознании человека. Осознание того факта, что понятия в естественных языках чаще всего обозначаются не словами, а словосочетаниями, а смысл устойчивых словосочетаний, как правило, не сводится к смыслу составляющих их слов, появилось в ЦНИИ Министерства обороны СССР еще в начале -х годов прошлого столетия. Это нашло свое отражение в ряде исследований и разработок этого института. Некоторые результаты этих работ были опубликованы [-, ]. В частности, в книге [] на стр. Там же сообщается о разработке тезауруса военных терминов объемом . А на стр. Таблица 1. Кол. Относит. Кол. Относит.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.171, запросов: 228