+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Построение модели извлечения информации из технических текстов

Построение модели извлечения информации из технических текстов
  • Автор:

    Бабина, Ольга Ивановна

  • Шифр специальности:

    10.02.21

  • Научная степень:

    Кандидатская

  • Год защиты:

    2006

  • Место защиты:

    Челябинск

  • Количество страниц:

    272 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы
"Глава 1. Модели и средства извлечения информации 
1.1. Основные понятия и определения теории информационного поиска

Глава 1. Модели и средства извлечения информации


1.1. Основные понятия и определения теории информационного поиска

1.2. Информационно-поисковые системы

1.2.1. ТипыИПС

1.2.2. Лингвистический компонент ИПС

1.2.2.1. Информационно-поисковые языки

1.2.2.2. Словарные средства ИПС

1.2.3. Оценка эффективности ИПС

1.3. Модели документального информационного поиска

1.3.1. Статистические модели поиска


1.3.1.1. Теоретико-множественные модели
^ 1.3.1.2. Векторные модели
1.3.1.3. Вероятностные модели
1.3.2. Лингвистические модели поиска
1.3.2.1. Синтаксические модели
1.3.2.2. Семантические модели
1.4. Поиск и извлечение информации в патентных исследованиях
1.5. Выводы по главе
|
Глава 2. Подъязык формул изобретения патентов на способ в фармакологии
2.1. Корпус текстов формул изобретения патентов
2.2. Общая характеристика лексики
2.3. Знаменательная лексика аргументов предикатов
2.4. Грамматическая и лексическая семантика предикатов
2.4.1. Морфологические характеристики предикатов
2.4.2. Валентности предикатов
2.4.3. Семантическая классификация предикатов
£ 2.4.3.1. Состав семантических классов предикатов
2.4.3.2. Семантический класс предикатов «Изменение состояния»
2.4.3.3. Семантический класс предикатов «Динамическое взаимодействие»
2.4.3.4. Семантический класс предикатов «Получение нового объекта»
2.4.3.5. Семантический класс предикатов «Выявление»
2.4.3.6. Семантический класс предикатов «Воздействие»
2.4.4. Функционирование предикатов в тексте патентной формулы
2.5. Служебные слова
* " 2.6. Выводы по главе

Глава 3. Модель извлечения информации из поискового массива формул изобретения патентов на способ
3.1. Общая схема модели извлечения информации
3.2. Модуль формирования «индексной» части информационного массива113
3.2.1. Разработка лексического компонента индексирования
3.2.1.1. Структура лексикона для автоматического анализа текста
3.2.1.2. Адаптация лексикона для патентных формул на способы в области фармакологии
3.2.2. Процедура индексирования и ее грамматический компонент
3.2.2.1. Общая схема индексирующей процедуры анализа
3.2.2.2. Первичное разбиение текста
3.2.2.3. Лексико-грамматический анализ текста
3.2.2.4. Семантико-синтаксический анализ текста
3.2.2.4.1. Восходящий анализ синтаксических конструкций
3.2.2.4.2. Восстановление кореференции именных групп
3.2.2.4.3. Поиск семантических зависимостей
3.2.2.5. Преобразование аргументов предиката
3.2.2.6. Определение состава компонентных зон
3.22.1. Заключительные замечания
3.3. Модуль формирования поискового предписания
3.4. Модуль выявления релевантных запросу документов
3.4.1. Тезаурус предметной области для процедуры сопоставления ПП и ПОД
3.4.2. Процедура сопоставления ПП и ПОД
3.4.2.1. Общая схема процедуры сопоставления
3.4.2.2. Поиск в ПОД кандидатов на соответствие единицам ПП
3.4.2.3. Сопоставление ПП и ПОД на уровне предикатно-аргументной конструкции
3.4.2.3.1. Сопоставление именных групп
3.4.2.3.1.1. Сопоставление головных существительных именных групп
3.4.2.3.1.2. Сопоставление прочих элементов в лексическом составе именных групп
3.4.2.3.1.3. Сопоставление валентностей аргументных выражений
3.4.2.3.1.4. Оценка сходства именных групп в целом
3.4.2.3.2. Сопоставление аргументного состава конструкций ПП и ПОД
3.4.2.3.3. Сопоставление предикатно-аргументных конструкций
3.4.2.4. Сопоставление ПП и ПОД на уровне компонентной зоны
3.4.2.5. Сопоставление ПП и ПОД на уровне запроса/документа
3.5. Выдача релевантных документов
3.6. Эксперимент по отбору текстов
3.7. Выводы по главе
Заключение
Список литературы
Приложения
Приложение 1. Корреляция морфологических форм предикатов и их
синтаксических функций
Приложение 2. Частотные характеристики функционирования предикатов в

Приложение 3. Типы морфем в названиях химических соединений
Приложение 4. Экспериментальный набор патентных формул
Приложение 5. Оформление запроса
Приложение 6. Пример работы процедуры отбора релевантных документов253
Приложение 7. Диаграммы релевантности документов запросам
Приложение 8. Программный комплекс Ling Assistant
Приложение 9. Лингвистическое программное обеспечение фирмы LanA Consulting
граммные средства - слайдеры, «блуждающие» по Интернету в поисках удовлетворяющих заданным требованиям документов и, в случае нахождения, добавляющие их к создаваемому корпусу. Определение механизма работы спай-дера и выявления «новых» для информационного массива текстов является больше технической задачей, поэтому она не входит в рассматриваемый нами круг вопросов.
Целью построения корпуса текстов в данном исследовании является анализ особенностей функционирования подъязыка патентных формул заданной ПО с последующим использованием результатов этого анализа для моделирования системы извлечения информации из массива текстов формул изобретения.
Исследовательский корпус, используемый в данной работе, представляет собой часть массива патентных текстов, хранящегося в американском ведомстве патентов и торговых марок. Построение корпуса (отбор патентных текстов, которые вошли в корпус для исследования) осуществлялось на основе следующих критериев:
1. Время регистрации: с 22.10.2002 по 15.06.2003;
2. Предметная область: Фармакология (для отбора по этому критерию использовалась традиционная национальная классификация патентов);
3. Объект изобретения: Способ.
По объекту изобретения патент может характеризовать устройство, способ, вещество, штамм, программное обеспечение и т.д. Ряд исследователей рассматривали в своих трудах лингвистические особенности текстов патентов на устройства [Шереметьева 1985; Могилевский 1978, 1979]. Внимание же к запатентованным способам не столь велико, а, следовательно, эта область менее изучена с точки зрения лингвистических особенностей ее описания.
Способ - «процесс выполнения взаимосвязанных действий, необходимых для достижения поставленной цели» [Фейгельсон 2001:17]. Способы, в свою очередь, могут представлять собой технологические процессы или способы действия. В корпус были включены лишь патенты первой категории способов.

Рекомендуемые диссертации данного раздела

Время генерации: 0.155, запросов: 967