+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Модели и алгоритмы распознавания коротких речевых команд на основе пробных спектральных преобразований входного сигнала

  • Автор:

    Нгуен Чи Тхиен

  • Шифр специальности:

    05.13.18

  • Научная степень:

    Кандидатская

  • Год защиты:

    2014

  • Место защиты:

    Тула

  • Количество страниц:

    162 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
1 ЗАДАЧИ ОБРАБОТКИ РЕЧЕВОГО СИГНАЛА
1.1 Кодирование речевого сигнала
1.1.1 Получение кратковременных амплитудных спектров из речевого сигнала.
1.1.2 Построение мел-частотпых кепстральнмх коэффициентов из спектра сигнала
1.2 Преобразование речевых сигналов
1.3 Распознавание речевых сигналов
1.3.1 Байесовский классификатор
1.3.2 Модель скрытой компоненты
1.3.3 Модель наблюдасаюй компоненты
1.3.4 Построение двухкомпонентного случайного процесса
1.3.5 Выбор начальных значений параметров модели
1.3.6 Вычисление апостериорного распределсннл для каждого класса речевых
сю налов
1.4 Основные цели и задачи исследовании
2 ЗАДАЧА ИДЕНТИФИКАЦИИ МОДЕЛИ РЕЧЕВОГО СИГНАЛА С ЦЕЛЬЮ АДЕКВАТНОГО ВОСПРИЯТИЯ
2.1 Эганы решения задачи идентификации модели речевого сигнала с целью адекватного восприятии
2.2 Обобщенная процедура обработки речевого сигнала
2.3 Задача распознавания речевых команд
2.4 Алгоритм распознавании речевых команд
2.5 Подбор параметров алгоритма распознавании
2.5.1 Процедура подбора параметров алгоритма распознавания
2.5.2 Исследование подбора параметров алгоритма распознавания
2.5.3 Посзроенне модели классов сигналов как смесей гауссовых распределений
2.5.4 Посзроенне модели классов сигналов как двухкомионситных случайных процессов
2.6 Подбор параметров алгоритма распознавания на основе скользящего контроля
2.6.1 Независимое тестирование алгоритма распознавания
2.6.2 Модифицированная процедура подбора параметров
2.6.3 Исследование подбора парааютров алгоритма распознавания модифицированной процедурой
3 ЗАДАЧА РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД ПРИ НЕДОСТАТОЧНОМ ОБЪЕМЕ ОБУЧАЮЩИХ ДАННЫХ
3.1 Влияние объёма и состава обучающей выборки па качество распознавании речевых команд
3.2 Многократный алгоритм распознавания речевых команд
3.3 Подбор значения параметра преобразования в построении многократного алгоритма распознавания речевых команд
3.4 Исследование многократного алгоритма распознавания речевых команд..
4 ЗАДАЧА РАСПОЗНАВАНИЯ РЕЧЕВЫХ КОМАНД НА ФОНЕ ШУМОВ
4.1 Увеличение значения отсчетов амплитудных спектров сигналов
4.2 Алгоритм распознавания команд на фоне шумов
4.3 Исследование алгоритма распознавания команд на фоне шумов
4.4 Подбор константы усиления амплитудных спектров с целью улучшения качества их распознавания
4.5 Многократный алгоритм распознавания речевых команд на фоне шумов.
4.6 Исследование многократного алгоритма распознавания команд на фоне шумов
4.7 Комбинирование способов уменьшения влияния шума на качество распознавания речевых сигналов
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ВВЕДЕНИЕ
В настоящее время сохраняется большой интерес исследователей к задачам компьютерной обработки речи, таким как их кодирование (Gibson [40], Chu [34]), генерация (Лобанов [18], Taylor [67]), а также распознавание (Woelfel [75], Neustein [57]).
Речь является главным объектом применения компьютеров для их обработки. Широко известны системы кодирования речи в телемеханике, генерации речи с текста, а что касается программ автоматического ввода речыо, то их использование стало массовым.
Особый интерес к компьютерной обработке именно речи в значительной мере определяется тем фактом, что эго естественный вид взаимодействия между людьми, а также между человеком и машиной.
Речь представлена в компьютере как последовательность скалярных пли векторных значений, и эта совокупность упорядочена вдоль оси временной переменной. Эту временную последовательность принято назвать речевым сигналом.
Одной из известных задач обработки речевых сигналов является задача распознавания речевых команд. В данной задаче необходимо принять решение о том, к какому классу относится речевой сигнал, где классом назовём множество разных произношений одной и той же команды.
В классической теории распознавания образов [5, 9, 26] объекты, подлежащие распознаванию, описываются векторами фиксированной размерности и представляются точками в пространстве своих характеристик. Однако в задаче распознавания речевых команд фиксация размерности сигналов не вполне естественна. Например, одну и ту же речевую команду диктор произносит с разными скоростями. В результате, длины записанных речевых сигналов одной команды являются различными.
Проблема сравнения речевых сигналов с разной длиной сначала решается методом динамического программирования [6, 63, 71]. Для этого

ной моделью цепи Маркова, р'^(х1)- плотность многомерного нормального распределения, вычисленная по (1.12) для текущих параметров <7(у^ -элемент текущей матрицы переходов £)(/<)■
2) Просмотром в обратном направлении от последнего момента I = т до начального момента / = 1 вычисляются распределения вероятностей
£'(*) =^кх>1 |у =/Д^)), / = 1,...Д частичной последовательности наблюдений Х>1=(хп,1<п< т) для текущей модели
*■(*) =(в(к)’Ц/суРк)’‘ = О и скрытого элемента у = /:
=1, / = е'(^) _ у 0(к) у /
/+1^+1 ’
где / = т — 1,т — .
3) Пусть является условной вероятностью того, что для теку-
щей модели при заданном наблюдении X в момент времени I цепь Маркова переходит из состояния ; в состояние у :
фк) =фк){3(=^(+]=]Х,Х(к)).
По правилу Байеса следует, что вероятность равна совместной
вероятности проявления X и события 5, =г',у+1 = у, деленной на вероятность проявления X :
,у,-(*) _ =|'^/+1 = 7.* !*■(*))
' Р(*\к))
Вероятность выражается через

Рекомендуемые диссертации данного раздела

Время генерации: 0.131, запросов: 967