Разработка алгоритмов построения оценок достоверности для систем распознавания речи

Разработка алгоритмов построения оценок достоверности для систем распознавания речи

Автор: Нгуен Минь Туан

Шифр специальности: 05.13.11

Научная степень: Кандидатская

Год защиты: 2008

Место защиты: Москва

Количество страниц: 102 с. ил.

Артикул: 4237429

Автор: Нгуен Минь Туан

Стоимость: 250 руб.

Разработка алгоритмов построения оценок достоверности для систем распознавания речи  Разработка алгоритмов построения оценок достоверности для систем распознавания речи 

Содержание
Содержание.
Введение.
Глава 1. Обзор современных методов распознавания речи и оценивания достоверности результатов распознавания
1.1 Вероятностный подход к моделированию и распознаванию речи
1.1.1 Извлечение признаков речевого сигнала.
1.1.2 Моделирование речевого сигнала на акустическом уровне .
1.1.3 Моделирование языковых ограничений.
1.1.4 Декодирование речевого сигнала.
1.2 Методы оценки достоверности результатов распознавания
1.2.1 Элементарные оценки достоверности
1.2.2 Оценки достоверности на основе вычисления апостериорных вероятностей
1.2.3 Оценки достоверности на основе формирования отношения правдоподобия
1.3 Выводы.
Глава 2. Оценки достоверности на основе отношения правдоподобия
2.1 Выбор моделей для построения отношения правдоподобия
2.2 Методы формирования оценок достоверности.
2.2.1 Двухуровневый метод формирования оценок достоверности.
2.2.2 Задание весовых коэффициентов
2.3 Обучение целевых и альтернативных моделей
2.3.1 Критерий обучения моделей
2.3.2 Обучение моделей методом градиентного спуска.
2.3.3 Улучшенный алгоритм обучения моделей.
2.4 Выводы.
Гласа 3. Экспериментальные применения.
3.1 Корпус речевых данных БаУо.
3.2 Базовая система распознавания речи.
3.2.1 Извлечение векторов признаков речевого сигнала.
3.2.2 Акустические модели звуков речи
3.2.3 Модель языка для корпуса данных РаУоИ. .
3.2.4 Эффективность распознавания для базовой системы
3.3 Результаты экспериментов.
3.3.1 Оценка параметров целевых и альтернативных моделей
3.3.2 Применения предлагаемых методов формирования оценок достоверности.
3.3.3 Сравнение эффективности предложенного метода с известными оценками достоверности.
3.4 Выводы.
Заключение
Приложение .
Приложение 2.
Библиография


Успехи в создании методов и технологий распознавания речи очевидны. С точки зрения известного японского специалиста С. Скрытых Марковских Моделей и -грамм. Успехи, достигнутые научными коллективами, можно количественно измерить результатами (например, в терминах основной характеристики эффективности систем распознавания речи - вероятности пословной ошибки распознавания), которые получены при решении специально выбранных тестовых заданий. В следующей таблице приведены вероятности пословной ошибки распознавания для лучших лабораторных систем распознавания речи, которые были получены мри испытаниях на четырех индикативных проблемно-ориентированных задачах. Для сведения также приведены характеристики сложности задач - размер словаря и перплексия (коэффициент ветвления) языка []. Распознавание слитно произносимых цифр 0. Из представленных данных следует, что распознавание естественной произвольной речи, тем более в ограниченном по полосе частот, канале передачи, каким является телефонный канал, далеко от удовлетворительного: каждое пятое слово распознается неправильно. Основная причина относительно невысокой эффективности систем речевой технологии заключается в вариативности речевого сигнала, которая обуславливается, например, индивидуальными особенностями дикторов, характеристиками каналов связи, а также влиянием окружающей обстановки. На эффективность автоматического распознавания речи также оказывают существенное влияние условия прикладной области, в частности, размер словаря. Как правило, словарь системы распознавания является замкнутым, то есть содержит все слова, которые могут быть произнесены и должны быть распознаны. Увеличение размера словаря, вообще говоря, снижает вероятность правильного распознавания. Потребность распознавания естественной, неограниченной, по словарному составу, речи, приводит к тому, что требование правильного распознавания всего высказывания вряд ли осуществимо и обычно не требуется. Поскольку в данном случае словарь системы является открытым, необходимо предусмотреть возможность отказа системы от распознавания каких-то частей речевого высказывания, которые содержат новые, не входящие в словарь системы, выражения и слова. Таким образом, появляется необходимость решения проблемы идентификации в речевом потоке новых, так называемых, несловарных (OOV, «out of vocabulary») слов или иных акустических событий. Естественным способом решения этой проблемы является синтез гак называемых оценок достоверности для результатов распознавания, на основе значений которых можно, в частности, идентифицировать OOV. Применение оценок достоверности также может повысить эффективность использования традиционных систем распознавания речи, оперирующих с замкнутыми словарями. Часто эти системы используются как составная часть более крупных автоматических систем, например, управления робототехническими комплексами, доступа к информационным ресурсам, диалоговых систем. В этом случае существует возможность коррекции ошибок автоматического распознавания речи на основе дополнительной информации, которой располагает система верхнего уровня. Такая коррекция будет более успешна, если система распознавания речи предоставит расширенную информацию о результате распознавания, включающую не только предполагаемые слова, но и оценку их достоверности. Важность решения проблемы построения эффективных оценок достоверности для систем распознавания речи увеличивается по мере дальнейшего прогресса в области речевых технологий. Это обстоятельство определяет актуальность исследований в этом направлении. Цель диссертационной работы заключается в исследовании и разработке эффективных алгоритмов построения оценок достоверности для систем автоматического распознавания речи. Исследование существующих методов моделирования и автоматического распознавания речи, а также известных методов построения оценок достоверности для систем распознавания речи. Разработка новых методов и алгоритмов построения оценок достоверности результатов работы систем распознавания речи.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.242, запросов: 244