Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала

Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала

Автор: Герасимов, Александр Вячеславович

Шифр специальности: 05.13.01

Научная степень: Кандидатская

Год защиты: 2007

Место защиты: Нижний Новгород

Количество страниц: 151 с. ил.

Артикул: 3385419

Автор: Герасимов, Александр Вячеславович

Стоимость: 250 руб.

Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала  Методы вычисления параметров устойчивой модели и признаков в задаче распознавания речевого сигнала 

1.1 Архитектура и задачи систем обработки речи. Место алгоритмов акустической ОБРАБОТКИ.
1.2 Акустическая модель речеобразования
1.3 Алгоритмы получения акустических признаков.
1.3.1 Анализ временных параметров
1.3.2 Кратковременный спектральный анализ , , .
1.3.3 Гомоморфная обработка .
1.3.4 Параметрическое моделирование авторегрессионная модель и линейное предсказание , , , .
1.4 Заключение и выводы по главе.
ГЛАВА 2 МЕТОД ВЫЧИСЛЕНИЯ ПАРАМЕТРОВ УСТОЙЧИВОЙ ЛИНЕЙНОЙ МОДЕЛИ И АКУСТИЧЕСКИХ ПРИЗНАКОВ ДЛЯ ВОКАЛИЗОВАННОГО РЕЧЕВОГО СИГНАЛА.
2.1 Метод вычисления параметров линейной модели
2.1.1 Расчет первичного набора параметров на основе собственных векторов разложения автокорреляционной матрицы сигнала
2.1.2 Связь разложения речевого сигнала по собственным векторам с гармонически.м разложением Писаренко.
2.1.3 Связь модели Писаренко сигнала с авторегрессионной моделью и методом линейного предсказания
2.1.4 Влияние белого шума наблюдения на авторегрессионные параметры
2.1.5 Описание алгоритма вычисления параметров модели
2.2 Экспериментальная оценка применимости модели к зашумленным речевым сигналам.
2.2.1 Анапа оценок амплитудных спектров, рассчитанных на основе коэффициентов традиционной и предложенной модели
2.2.2 Сравнительный анализ устойчивости параметров модели по отношению к шумам.
2.3 Расчет акустических признаков
2.3.1 Проблема выбора метрики для сравнения признаков
2.3.2 Алгоритм вычисления кепстразьных коэффициентов по коэффициентам параметрической модели
2.3.3 Визуальная оценка сходства формантной картины и огибающей спектра рассчитанной по акустическим признакам на основе предлагаемого метода.
2.4 Сравнительный анализ шумовой устойчивости алгоритмов вычисления акустических признаков
2.5 Заключение и выводы по главе.
ГЛАВА 3 ИССЛЕДОВАНИЕ ВЛИЯНИЯ ПОМЕХ НА АКУСТИЧЕСКИЕ ПРИЗНАКИ И РЕШЕНИЕ ЗАДАЧИ ИХ УСТРАНЕНИЯ
3.1 Постановка задачи
3.2 Методы фильтрации сигнала
3.3 Метод фильтрации сигнала на основе анализа собственных чисел разложения его автокорреляционной матрицы.
3.4 Проблемы, связанные с обработкой реального немодельного сигнала
3.4.1 Исследование поведения собственных чисел разложения А КМ для реальных сигналов и шумов.
3.5 Исследование влияния помех на признаки. Методы устранения нежелательных последствий
3.5.1 Влияние тренда на распределение собственных чисел и способы его устранения .
3.5.2 Влияние низкочастотных составляющих сигнала на распределение собственных чисел и способы их коррекции.
3.6 Оценка эффективности фильтрации в зависимости от уровня шума
3.7 Заключение и выводы по главе
ГЛАВА 4 МЕТОДЫ ВЫЧИСЛЕНИЯ ПОРЯДКА ПАРАМЕТРИЧЕСКОЙ МОДЕЛИ
4.1 Постановка задачи
4.2 Традиционные способы определения порядка модели и их применимость к задаче кодирования речевых сигналов.
4.2.1 Пороговый метод.
4.2.2 Методы минимизация целевой функции критерии Акаике.
4.3 Метод определения порядка модели на основе сравнения амплитудных оценок спектра моделей смежных порядков ,
4.3.1 Свойство подобия спектральных и формантных картин
4.3.2 Описание алгоритма
4.4 Метод определения порядка модели на основе сравнения векторов параметров для различных методов линейного прогнозирования ,.
4.4.1 Подобие параметров коэффициентов традиционного и модифицированного методов линейного предсказания
4.4.2 Описание алгоритма
4.5 Сравнительный анализ устойчивости работы алгоритмов определения порядка модели в условиях помех.
4.6 Заключение и выводы по главе
ГЛАВА 5 АНАЛИЗ ЭФФЕКТИВНОСТИ РАБОТЫ МЕТОДА ПОЛУЧЕНИЯ АКУСТИЧЕСКИХ ПРИЗНАКОВ. МЕТОДИКИ ТЕСТИРОВАНИЯ
5.1. Тестирование метода акустической обработки.
5.1.1 Схема блока акустической обработки сигнала, построенного на базе предлагаемого метода
5.1.2 Схема блока акустической обработки сигнала, применяемого в распознающей системе 1I
5.2. Методика оценки устойчивости алгоритмов акустического кодирования.
5.2.1 Создание алфавита акустических речевых единиц
5.2.2 Метод оценки ошибок классификации
5.2.3 Сравнительный анализ устойчивости работы алгоритмов акустической обработки
5.3. Заключение и выводы по главе.
ЗАКЛЮЧЕНИЕ
СПИСОК ЛИТЕРАТУРЫ


Для решения задач сравнения и классификации сигналов по их акустическим признакам в качестве таких признаков используются кепстральные коэффициенты, для которых имеются алгоритмы сравнения и большой опыт применения в системах обработки речи. Кепстральные коэффициенты вычисляются на основе коэффициентов традиционного линейного предсказания с помощью алгоритма, который может быть легко распространен и на модифицированный метод предсказания. Третья глава посвящена вопросам ослабления влияния на акустические признаки присутствующих в сигнале аддитивных помех. Формулируется задача фильтрации, описываются применяемые подходы. Рассматривается применимость алгоритма фильтрации собственных чисел автокорреляционной матрицы для речевых сигналов как алгоритма фильтрации в пространстве признаков. Экспериментально исследуется влияние различных помех на признаки, предлагаются способы ослабления или полного устранения их влияния. В заключительной части главы приводятся результаты экспериментального исследования эффективности работы алгоритма фильтрации в зависимости от уровня шума. В четвертой главе рассматривается проблема определения порядка линейной параметрической модели. Формулируются отличия от классической задачи оценки порядка модели и основные возникающие проблемы. Приводятся существующие подходы к оценке порядка модели, рассматривается их применимость к моделированию реальных речевых сигналов. Предлагается два метода определения порядка модели, ориентированных на специфику речевого сигнала. Первый метод основан на анализе сходства спектральных оценок, соответствующих смежным порядкам моделей. Второй метод основан на анализе соответствия векторов коэффициентов, вычисленных с помощью традиционного метода линейного предсказания и предложенного метода. Приводятся экспериментальные результаты сравнительного исследования эффективности определения порядка модели. Оценивалась корректность классификации входных акустических данных сформированным вокализованным данным полного фонемного алфавита. Для проведения исследования эффективности работы блока акустического кодирования, в качестве входного сигнала использовался сформированный фонетический алфавит, состоящий из гласных и носовых звуков. Оценивался процент ошибочных отнесений зашумленного экземпляра фонемы к остальным фонемам сформированного алфавита. Для сравнения был взят метод акустического кодирования, используемый в одной из существующих систем распознавания речи. Приведенные в главе результаты исследования, показывают, что процент ошибок классификации фонем для предложенного метода ниже, чем для стороннего метода, что говорит об устойчивости акустических признаков, вычисленных предложенным методом. В заключении содержится сводка основных результатов по всем главам, и даются выводы по работе в целом. В приложении 1 приводится вывод формулы разложения по собственным векторам автокорреляционной матрицы сигнала, представляющего собой смесь синусоид в белом шуме. В приложении 2 обосновывается выбор модели авторегрессии скользящего среднего в качестве подходящей модели для вокализованного речевого сигнала. Приводится процедура нахождения параметров модели. Архитектура и задачи систем обработки речи. Место алгоритмов акустической обработки. Простейшая задача состоит в распознавании фиксированного набора изолированных слов, разделенных паузами . Принятие решения о произнесенном слове может осуществляться простым сопоставлением с шаблоном из словаря и не требует применения алгоритмов семантического анализа. Такая задача возникает при голосовом наборе номера или при обучении пользователя правильному произношению слов языка. При гарантии наличия пауз между словами, также возможно распознать лингвистически ограниченные последовательности изолированных слов например поворот. При слитном произношении сообщения возникает трудность определения начала и конца слов. Кроме того, наличие соседних слов оказывает влияние на произношение каждого слова. В этом случае задача распознавания может быть ограничена, например распознаванием жестко заданной последовательности слов.

Рекомендуемые диссертации данного раздела

28.06.2016

+ 100 бесплатных диссертаций

Дорогие друзья, в раздел "Бесплатные диссертации" добавлено 100 новых диссертаций. Желаем новых научных ...

15.02.2015

Добавлено 41611 диссертаций РГБ

В каталог сайта http://new-disser.ru добавлено новые диссертации РГБ 2013-2014 года. Желаем новых научных ...


Все новости

Время генерации: 0.240, запросов: 244