Диссертация на тему "Разработка и совершенствование математических моделей речевых сигналов для задач анализа и синтеза речи", скачать бесплатно автореферат по специальности 05.13.18 - Математическое моделирование, численные методы и комплексы программ

ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ
ГЛАВА 1.Проблемы анализа и синтеза речи
1.1. Вопросы анализа и синтеза речи человека
1.1.1. Классификация задач анализа речи
1.1.2. Состояние разработок систем анализа......................речи
1.1.3. Классификация задач синтеза речи
1.1.4. Состояние разработок систем синтеза речи
1.2. Способы параметризации речевого сигнала для задач анализа и синтеза речи
1.2.1. Общие подходы к параметризации речевого сигнала для задач анализа речи
1.2.2. Параметризация речевого сигнала на основе спектрального анализа
1.2.3. Параметризация речевого сигнала на основе линейного предсказния
1.2.4. Параметризация речевого сигнала на основе кепстрального анализа
1.2.5. Параметризация речевого сигнала на основе вейвлет-анализа
1.2.6. Подходы к параметризации речевого сигнала для задач синтеза речи
1.3. Математические модели принятия решений для задач анализа речи
1.3.1. Критерии вычисления расстояний между параметрами
1.3.2. Применение скрытых марковских моделей для задач анализа

1.3.3. Применение искусственных нейронных сетей для задач анализа речи
1.3. Сходство и различия математического аппарата, используемого при описании речевого сигнала для задач анализа и синтеза речи
Выводы к главе

ГЛАВА 2. Математические модели речевых сигналов для анализа и синтеза вокализованных сегментов речи
2.1. Характеристика звуков русской речи и фонем русского языка
2.2. Подходы к описанию вокализованных сегментов речи
2.2.1. Математические модели и особенности описания гласных и сонорных звуков
2.2.2. Математическая модель в виде импульса колебания с амплитудно-частотной модуляцией со сложным несущим колебанием
2.3. Методы оценки параметров математических моделей речевых сигналов
2.3.1. Анализ частоты основного тона оптимальным методом
2.3.2. Точностные характеристики оценки частоты основного тона
2.3.3. Анализ амплитудных коэффициентов математической модели вокализованного сегмента речи
2.4. Математическая модель принятия решения для распознавания гласных звуков
2.5.Алгоритм дикторонезависимого распознавания гласных звуков
Выводы к главе
ГЛАВА 3. Математическая модель речевого сигнала для задач анализа и синтеза нсвокализованных сегментов импульсного источник
3.1. Подходы к описанию невокализованных сегментов речи
3.2. Математическая модель импульсного источника речевого сигнала применительно к описанию взрывных звуков речи
3.3. Расчет параметров полигауссовской математической модели
3.4. Проверка па адекватность полигауссовской математической модели
импульсного источника речевого сигнала
Выводы к главе

ГЛАВА 4. Обобщенная математическая модель речевого сигнала для задач анализа и синтеза речи
4.1. Математическая модель вокализованных сегментов речевого
сигнала, основанная на модели речевого тракта
4.2. Проверка на адекватность математической модели речевого сигнала в виде частотно-модулируемого колебания со сложной несущей
4.2.1. Сравнительный анализ аналитического решения дифференциального уравнения анализ с численным решением методом Рунге-Кутта
4.2.2. Сравнительный анализ аналитического решения дифференциального уравнения с полигармонической математической моделью с частотной модуляцией
4.2.3. Метод расчета индекса частотной модуляции математической модели речевого сигнала
4.3. Обобщенная математическая модель речевого сигнала
4.3.1. Способы и критерии сепарации речевого сигнала на вокализованные и невокализованные сегменты речи
4.3.2. Метод сепарации речевого сигнала для обобщенной математической модели
Выводы к главе
ЗАКЛЮЧЕНИЕ
ЛИТЕРАТУРА
ПРИЛОЖЕНИЯ
Приложение 1. Таблицы значений точностных оценок частоты
основного тона
Приложение 2. Таблицы значений амплитудных коэффициентов математической модели вокализованного сегмента речи

формация не зависит от содержания речи и заключается в характерных особенностях организации речи и акустики голоса, таких как тембр, высота, громкость, интонация, ритм.
Таким образом, при разработке математических моделей распознавания и синтеза речи необходимо учитывать не только акустическую природу речевого сигнала и физические его характеристики, но и методы смысловой интерпретации речевого сигнала [13,161].
При построении системы обработки сигналов для анализа речи необходимо выбрать адекватный способ параметризации, позволяющий максимально использовать информацию, содержащуюся в речевом сигнале. Задача параметризации речевого сигнала является одной из ключевых в области речевых технологий и до сих пор не решена в полной мере, так как не решена задача построения абсолютно (идеально) адекватной модели представления речевых структурных единиц, позволившей бы с высокой точностью распознавать речь.
1.2.1. Общие подходы к параметризации речевого сигнала для задач анализа речи
Речевой сигнал непрерывно изменяется вследствие работы голосового аппарата человека и соответственно является нестационарным случайным процессом. Поэтому оценивание его вероятностных характеристик, таких как функция плотности вероятностей (ФПВ), спектральной мощности, корреляционной функции и т.п., строго говоря, нельзя выполнять усреднением во времени одной реализации. Такое усреднение можно осуществлять лишь на коротких промежутках времени, где характеристики допустимо считать постоянными, а случайный процесс - «локально-стационарным» и «локально-эргодическим». При проектировании систем передачи, в которых нестационарные свойства речевого сигнала не используются, обычно сигнал считают стационарным и эргодическим, и тогда операция усреднения за некоторый интервал времени приобретает смысл оценивания характеристик близкого в какой-то мере к речевому сигналу стационарного случайного процесса - ста-

Название работы	Автор	Дата защиты
Исследование некоторых математических моделей методом быстрых разложений	Лешонков Олег Владимирович	2018
Методы ускорения расчетов математических моделей молекулярной динамики на гибридных вычислительных системах	Марьин, Дмитрий Фагимович	2015
Динамика уравнений первого порядка с большим запаздыванием	Кащенко, Илья Сергеевич	2006

Электронная библиотека диссертаций

Разработка и совершенствование математических моделей речевых сигналов для задач анализа и синтеза речи

Рекомендуемые диссертации данного раздела