Разработка программных средств повышения уровня автоматизации и качества семантического поиска мультимедиа ресурсов

Разработка программных средств повышения уровня автоматизации и качества семантического поиска мультимедиа ресурсов

Автор: Новиков, Сергей Владимирович

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2011

Место защиты: Москва

Количество страниц: 130 с. ил.

Артикул: 5077822

Автор: Новиков, Сергей Владимирович

Стоимость: 250 руб.

Разработка программных средств повышения уровня автоматизации и качества семантического поиска мультимедиа ресурсов  Разработка программных средств повышения уровня автоматизации и качества семантического поиска мультимедиа ресурсов 

Оглавление
Введение
Глава 1. Анализ класса рассматриваемых систем, методов поиска, и возможностей i для автоматического обнаружения знаний о мультимедиа ресурсах
1.1 Анализ рассматриваемого класса систем и выделение решаемых задач
1.2 Обзор и обоснование использования i для систем управления мультимедиа ресурсами
1.3 Постановка задачи
1.4 Выводы по первой главе.
Глава 2. Разработка методов объединения онтологических баз знаний i для описания предметной области мультимедиа ресурсов.
2.1 Использование репутации и явно определенных политик для оценки уровня доверия к конкретному утверждению
2.2 Методы объединения оптологий.
2.3 Разработка алгоритма объединения двух и более источников знаний
2.4 Выводы по второй главе.
Глава 3. Разработка алгоритмов автоматизации семантических аннотаций высокоуровневыми концептами
3.1 Поиск новых угверждений на основе имеющегося небольшого набора.
3.2 Реализация и представление результатов алгоритмов обнаружения низкоуровневых свойств для их использования в поиске концептов высокого уровня
3.3 Вывод на основе правил связи низкоуровневых концептов с высокоуровневыми
3.4 Выводы третьей главе.
Глава 4. Разработка программного инструмента, автоматизирующего процесс аннотации .
4.1 Архитектура приложения.
4.2 Реализация предложенных алгоритмов и решений
4.3 Тестирование и апробация разработанного программного решения
4.4 Выводы но четвертой главе.
Заключение
Список литературы


Сложность этой проблемы близка к сложности распознавания естественных языков. Несмотря на достижение определенных результатов, например, в поиске изображений «по примеру», когда ищутся изображения, похожие на представленные в системе, возможности использования таких алгоритмов в системах управления мультимедиа ресурсами ограничены. Это связано с тем, что пользователей обычно интересуют концепты, образы, которые должны быть визуализированы мультимедиа ресурсом. Потому любые материалы в системе должны быть аннотированы. На сегодняшний день, в зависимости от сложности системы, типов ресурсов, с которыми она работает и специфики целевого пользователя, такие системы могут использовать наборы фиксированных полей, полнотекстовые описания, ключевые слова, реже встречается использование внутреннего словаря для описания понятий, который вносит некоторый уровень семантики в описания. Собственные словари - это информация о концептах (объектах, действиях, событиях), связанная с текстовой меткой (словами). Во всех остальных случаях машина совсем «не понимает смысла» аннотации и может обрабатывать и искать только синтаксически близкие слова и их сочетания. Несмотря на то, что алгоритмы поиска по текстовым документам на основании синтаксического сходства совершенствовались много лет и в этой сфере были достигнуты существенные результаты, релевантность поиска остается относительно низкой, особенно когда имеется большое количество относительно похожих по синтаксическим описаниям ресурсов и требуется сузить поисковую выдачу. Ввод собственных словарей является попыткой разрешить проблемы многозначности слов в естественных языках. Например, слово ”лук” может означать и овощ, и оружие, а система не будет “знать”, что именно ищет пользователь. Однако, для того чтобы действительно воспользоваться существенными преимуществами семантического подхода, требуется, чтобы словарь содержал в себе описания с высокой степенью выразительности и на достаточно «широком» домене понятий, что в современных системах практически не встречается. Обычно, когда используются такие словари, то на этапе аннотации уточняется, какое именно значение слова имелось в виду (например, на этапе ввода ключевых слов). Если слово имеет различные значения, то во время поиска пользователю предлагается уточнить, какое значение он на самом деле имеет в виду из множества возможных вариантов. Собственные словари способны, в зависимости от их детализации, решать задачу уточнения понятий и описаний. Однако их использование влечет ряд других проблем. Существенным является ограничение, заключающееся в невозможности обмена с другими системами, которые используют другой словарь или не используют его вовсе. В таком случае набор проблем вырождается до ситуации, когда вообще никакой словарь. Типичная ОАМ система сегодня имеет свои, отличные от других систем, модели и форматы хранения метаданных, обычно основанные на реляционном подходе. Современные системы имеют АРІ или УсЬ сервисы для предоставления доступа к внутренней базе метаданных. В таких случаях невозможно обмениваться метаданными, или часть из них будет потеряна, либо придется явно программировать связь между каждыми двумя системами. Интегрировать каждую систему с каждой таким способом, в общем случае, неэффективно, а часто просто невозможно ввиду их количества и числа отличий в моделях метаданных. В реальном мире обмен мультимедиа ресурсами осуществляется очень часто, и необходимость универсального механизма обмена качественными аннотациями стоит достаточно остро. Сегодня, в случае* мультимедиа ресурсов, основным источником метаданных является ручное аннотирование. В больших медиа компаниях есть специальная должность архивиста - человека, задача которого составлять описания. Как правило, имеется определенная, выработанная методика для создания аннотаций в соответствии со , спецификой материала, например, «новости» или «спорт» внутри данной организации и/или системы управления мультимедиа ресурсами. Проблема заключается в том, что ручные описания требуют относительно больших затрат ресурсов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.210, запросов: 244