+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Корпусные методы в лексикографии: опыт создания модели Словарного корпуса

  • Автор:

    Саженин, Игорь Игоревич

  • Шифр специальности:

    10.02.01

  • Научная степень:

    Кандидатская

  • Год защиты:

    2013

  • Место защиты:

    Новосибирск

  • Количество страниц:

    193 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

Оглавление
Оглавление
Введение
Глава 1 Электронные словари: проблема определения понятия и
характеристика существующих продуктов
1.1 Электронный словарь, автоматический словарь, автоматизированный
словарь: соотношения понятий
1.2. Электронный учебник уб традиционный учебник: механизмы определения
1.3. Критерии описания электронных лексикографических ресурсов
1.4 Обзор электронных лексикографических ресурсов
Выводы
Г лава 2 Языковые корпусы как инструмент исследовательского процесса
2.1. Понятие корпуса и корпусной лингвистики
2.2. Обзор корпусов. Характеристика русскоязычных корпусов
2.3. Возможности использования корпусов в исследовательском и учебном
процессах
Выводы
Глава 3. Словарный корпус: технология создания и возможности использования
3.1. Технология создания Словарного корпуса
3.2. Определение объема и содержания массива данных
3.3. Определение параметров поисковой системы
3.4. Содержательно-целевой фактор определения параметров поисковой системы
3.4. Дидактический фактор определения параметров поисковой системы
3.5. От технологии к модели
Выводы
Заключение
Список использованной литературы

Введение
Настоящее диссертационное исследование выполнено на стыке лексикографии и корпусной лингвистики. С момента начала применения информационных технологий в гуманитарной сфере прошло не одно десятилетие. За это время успели выделиться в самостоятельные направления такие области филологической науки, как компьютерная лингвистика, корпусная лингвистика и компьютерная лексикография. В рамках данных, в первую очередь, прикладных направлений были созданы инструменты, позволившие во многом облегчить труд исследователя. Мы имеем в виду, прежде всего, языковые корпусы и электронные лексикографические ресурсы. Создание и развитее данных инструментов шли отличными друг от друга путями. Если в области корпусной лингвистики главную роль играли, все-таки, специалисты-филологи, то компьютерная лексикография была отдана во многом на откуп профессиональным программистам и бизнесменам, и это не в последнюю очередь заслуга господства в современном обществе рыночных отношений: когда спрос на электронные лексикографические продукты определяется потребностями практического характера. По этой причине наиболее совершенными и многофункциональными лексикографическими продуктами на сегодняшний день являются переводные многоязычные словари. Специализированные же лексикографические продукты прогресс если не обошел стороной, то, по крайней мере, не сказался должным образом на их развитии.
Еще в начале восьмидесятых годов пошлого века в нашей стране велись
работы в области специализированной компьютерной лексикографии. В данной
области были заняты такие ученые как А. П. Ершов, Ю. Н. Караулов, В.М.
Андрющенко, А. Я. Шайкевич и др. Ряд идей и разработок Машинного фонда
русского языка в последствии лег в основу создания Национального корпуса
русского языка. Однако, по словам В.М. Андрющенко, информатизация
русистики в тех организационных и финансовых условиях как направление
оказалось нежизнеспособным. Возможно, по этой причине до сих пор для

компьютерной лексикографии не сформирован собственный предмет изучения, а лексикографическая теория отстает от компьютерной лексикографической практики.
Технический инструментарий, используемый при разработке электронных лексикографических ресурсов, изначально не ориентирован на обеспечение работы со словарным содержанием, а наиболее перспективные методы, разработанные в области, например, корпусной лингвистики, не столь активно применяются в практике создания электронных лексикографических ресурсов (В. П. Селегей 2005, Я. Перванов 2010). Кроме того, существует множество электронных лексикографических ресурсов, отличающихся друг от друга содержанием, структурой, назначением, техническим инструментарием, которые часто именуются электронными словарями. При этом один такой продукт настолько отличается от другого по ряду критериев, что возникает сомнение в правомерности отнесения таких ресурсов к одной категории.
Основной проблемой при создании электронных лексикографических ресурсов является то, что машина не способна в полной мере работать с текстом на естественном языке для репрезентации пользователю информации, соответствующей возможному спектру его запросов (В. П. Селегей 2005, Я. Перванов 2010). Данная проблема была решена специалистами, разрабатывающими корпусы текстов посредством использования такого инструмента, как разметка. Как отмечают М. В. Копотев и А. Мустайоки «...современная корпусная лингвистика, несмотря на относительно короткую историю существования, является хорошо разработанным направлением языкознания, тесно связанным с компьютерной и когнитивной лингвистикой. С первой она связана технологией и инструментами обработки языкового материала, со второй совпадает в базовой предпосылке: как когнитивная, так и корпусная лингвистика интересуется речевой деятельностью, представленной в бесконечном числе текстов. <...> Каждый новый этап в развитии машинной обработки языкового материала открывает новые возможности сначала для

ЛштсВ1с СоЫепЛШ StarDict Программы, сайты и др. АВВУУ Ыпруо П1СТ — сетевой протокол Мулътитран Ро^Ьявит МулътиЛекс - русско-английские, немецкие, французские, испанские, итальянские, португальские и многоязычные словари. Включают толковые словари и тематические словарные базы для перевода специализированной лексики.
6 См. также Онлайновый словарь
Обратимся к фрагменту № 1. Авторы данного определения ставят во главу угла такое основание, как форма существования объекта, локализуя его (объект) в компьютере или другом электронном устройстве. В данном случае, очевидно, имеет место оппозиция электронная форма уя иная, не электронная форма; а также оппозиция компьютер уэ иное электронное устройство.
Следующий фрагмент словарной статьи, фрагмент №2, позволяет нам выявить еще ряд признаков, присущих описываемому объекту.
Во-первых, это возможность быстро найти нужное слово. То есть в оппозиции электронная форма уэ иная форма, электронная форма обладает таким преимуществом по сравнению с не электронной формой, которое позволяет осуществить операцию по поиску нужного слова быстрее. Иными словами, словарь, существующий в электронной форме, имеет техническое решение или инструмент, позволяющий проводить поисковые операции с

Рекомендуемые диссертации данного раздела

Время генерации: 0.196, запросов: 967