+
Действующая цена700 499 руб.
Товаров:6
На сумму: 2.994 руб.

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Моделирование семантической структуры текстов научно-технического содержания в связи с автоматизацией информационных процессов.

  • Автор:

    Лавренова, Ольга Александровна

  • Шифр специальности:

    10.02.21

  • Научная степень:

    Кандидатская

  • Год защиты:

    1978

  • Место защиты:

    Москва

  • Количество страниц:

    280 с.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Темпы современного развития научно-технического прогресса поставили перед человеком сложную и многоплановую проблему поиска необходимой информации в огромном массиве сведении, входящих в "искусственную память человечества" - книги, журналы и т.д. По данным, приводимым в различных источниках, в мире выходит 30-50 тыс. научно-технических журналов, ежегодно издается до 75 тыс. книг по науке и технике, публикуется более 300 тыс. описаний к авторским свидетельствам и патентам /Михайлов и др., 1968/. Общий объем мировой научно-технической информации удваивается каждые 10-15 лет. Ежедневно в мире издается в различной форме около 100 печатных листов текста в расчете на одного специалиста. В связи с этим часто оказывается легче самому вновь сделать открытие, чем найти соответствующие сведения в литературе /Добрав, 1970/.
Одной из важнейших задач, требующих практического решения в нашей стране, является проблема создания единой государственной системы научно-технической информации /ГАСНТИ/, основанной на использовании машинных методов в процессах обработки, хранении , поиска, выдачи и передачи на расстояние научно-технической информации.
Проблема автоматизации информационного поиска связана с разработкой целой системы вопросов, которые относятся к различным областям науки: информатике, математике, логике, лингвистике, психологии, вычислительной технике, полиграфии, библиотековедению, науковедению и т.д.
Особое значение в свете автоматизации информационных процессов имеют лингвистические исследования, "поскольку материальной оболочкой научной информации может быть только адекватный ее сущности язык" /Семенюк, 1977, с.5/.

Главным носителем вводимых и обрабатываемых в автоматизированных системах научно-технической информации (АСНТН) сведений являются тексты на естественных языках. Поэтому на первый план выдвигается проблема выявления и представления в удобном для машинной обработки виде смыслового содержания текстов информационных документов и запросе®, решаемая в рамках общей проблемы создания автоматизированных систем обработки текстов (АООТ) как обязательного компонента систем, решающих различные задачи управления и интеллектуального моделирования (см./Городецкий. 1976/).
Формализованного описания семантической структуры текстов требует специфика их обработки с помощью ЭВМ: от машины нельзя ожидать того интуитивного, почти неосознанного оперирования смыслом, которое свойственно человеку.
В сфере автоматизации информационных процессов обработка текстов проявляется в виде их реферирования и индексирования, т.е. перевода содержания текстов на информационно-поисковый язык (ИЩ) для ввода в память машины. Такая обработка текстов на естественном языке осуществляется "ради семантической информации, запечатленной в данном языке, и с точки зрения этой семантической информации" /Звегинцев, 1968, с.215/.
Эксплицитное представление информации, знаний (в узком

смысле - как совокупности сведений, данных о действительном мире), содержащихся в речевых высказываниях, а также некоторой предварительной системы знаний, которая обеспечивает их понимание человеком, составляет одну из самых важных и сложных задач, стоящих на пути решения таких проблем, как автоматизация информационных процессов, автоматический перевод с одного языка на другой, разработка моделей памяти и пснимания, моделей

решения задач и других моделей, имитирующих какие-либо виды человеческого поведения, связанного с восприятием и пониманием текста. Все эти проблемы можно объединить под названием нового направления в науке - создания "искусственного интеллекта".
Кроме того, формализованное описание смысла текста представляет собой в настоящее время одну из главных и наиболее перспективных задач теоретической лингвистики, так как это направление вносит существенный вклад в решение центральной проблемы языкознания - изучение соотношения "между звучаниями и значениями"
Что касается автоматизированных систем обработки информации, то, по нашему мнению, способ представления (моделирования) информации, содержащейся в текстах, должен обеспечивать комплексное решение следующих проблем:
построение модели общего смысла целого сообщения путем извлечения информации, наиболее существенной с точки зрения задачи автоматизации поиска научно-технической информации;
дополнение лингвистически релевантного семантического содержания вводимого в систему текста необходимыми энциклопедическими знаниями *;
построение в памяти ЭВМ массива информации нелинейного вида, сводной системы знаний, заключенных во всем массиве текстов, т,е. так называемого "гипертекста" ш
^^ц^Обзо^проблемы: /Попов, Фирдман, 1976/, /Перцова,1976/,
** В работе /Нельсон, 1970/ подчеркивается эффективность такого рода массивов информации и необходимость обеспечения потенциальной возможности построения "гипертекста или нелинейного текста" в информационных системах будущего. См. об этом также в /Бобров, 1975/.

информацию о потребности, т.е. множество пустых и сомнительных мест. Остальные элементы и отношения выступают в качестве "о п о р н ы х", и их должно быть достаточно для определения места потребности в гипертексте.
В лингвистическом аспекте различие между старой и новой информацией лежит в основе идеи актуального членения, т.е. проблемы, которая обсуждается с использованием терминов "исходная точка" И "ЯДРО", " theme " И " rheme " ("ТвМЭ И Рема"), "МОДУС"
И "ДИКТУМ", " topic. " И " comment ", а ТЭКЖв СПОраДЕЧвСКИ НвКОторых других *. В последнее время проблема актуального членения перенесена с предложения на целые тексты **•
С нашей точки зрения, в текстах далеко не всегда совпадают противопоставления: старая и новая информация в смысле - "знания" и "старое" и "новое" в плане актуального членения.
Первое противопоставление определяется системой знаний автора текста и его представлениями о тезаурусах адресатов, второе - в значительной степени коммуникативным намерением автора, его коммуникативным заданием. Очень часто темой текста (в смысле актуального членения) оказывается именно то новое знание, которое автор хочет сообщить адресатам.
При моделировании семантики текстов в СемВД целесообразно каким-то образом отражать актуальное членение содержания текста документа (выделить "тему" и "рему"). Это касается преимущественно СемГЩ для документальных систем, так как актуальное членение часто
1975/.
См., например, / Danes f 1970/, ЛСотляр,1974/.

Рекомендуемые диссертации данного раздела

Время генерации: 0.121, запросов: 1062