Диссертация на тему "Разработка и исследование субполосных методов и алгоритмов сегментации речевых сигналов", скачать бесплатно автореферат по специальности 05.13.17

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
ЕЛАВА 1 СОВРЕМЕННЫЕ МЕТОДЫ И АЛГОРИТМЫ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ
1.1 Основные характеристики звуков русской речи
1.2 Исследование существующих алгоритмов селекции пауз
1.3 Исследование существующих алгоритмов сегментации речевых
сигналов
1.4 Исследование существующих алгоритмов оценивания периода
основного тона
1.5 Основные положения субполосного анализа сигналов
1.6 Задачи исследования
ГЛАВА 2 СУБПОЛОСНЫЕ МОДЕЛИ ОТРЕЗКОВ РЕЧЕВЫХ СИГНАЛОВ И СЕЛЕКЦИЯ ПАУЗ МЕЖДУ ЗВУКАМИ РЕЧИ
2.1 Вычислительные аспекты субполосного анализа отрезков РС
2.2 Распределение энергий по частотным интервалам отрезков РС,
порождаемых разными звуками русской речи
2.3 Селекция пауз между звуками речи
2.4 Результаты и выводы главы
ГЛАВА 3 СЕГМЕНТАЦИЯ РЕЧЕВЫХ СИГНАЛОВ ПО ГРАНИЦАМ ЗВУКОВ РУССКОЙ РЕЧИ
3.1 Метод и алгоритм определения границ звуков русской речи..
3.2 Селекция вокализованных звуков русской речи и оценка периода
основного тона
3.3 Результаты и выводы главы
ГЛАВА 4 ПРОГРАММНАЯ РЕАЛИЗАЦИИ АЛГОРИТМОВ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ
4.1 Описание структуры программной реализации алгоритмов
сегментации РС

4.2 Интерфейс прототипа программной поддержки алгоритмов сегментации РС
4.3 Рекомендации по выбору параметров
4.4 Результаты и выводы главы
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А
ПРИЛОЖЕНИЕ Б
ПРИЛОЖЕНИЕ В
ПРИЛОЖЕНИЕ Г
ПРИЛОЖЕНИЕ Д
ПРИЛОЖЕНИЕ Е

ВВЕДЕНИЕ
Актуальность диссертационного исследования. Устная речь является одной из наиболее естественных для человека форм информационного обмена. В соответствии с этим существенное внимание уделяется разработке методов автоматического анализа устной речи на компьютерах, одним из важнейших направлений развития которых является совершенствование человекомашинных интерфейсов. При этом обработке подвергаются речевые сигналы (PC), которые представляют собой результаты регистрации электромагнитных колебаний на выходе микрофонов, возбуждаемых акустическими воздействиями. В определенном смысле базовым этапом автоматического анализа устной речи служит сегментация PC на отрезки, которые порождены в разных условиях. Наибольший интерес представляет выделение участков, зарегистрированных при отсутствии звуков речи (селекция пауз, в том числе при сжатии речевых данных), определение границ участков, порождаемых разными звуками речи и определение среди последних отрезков, порождаемых вокализованными звуками (в задачах идентификации дикторов и оценки их психофизического состояния, распознавания речи и ее вокодерного синтеза с помощью липредеров и т.д).
Проблема анализа речевых сигналов рассматривалась в достаточно большом количестве работ зарубежных и российских авторов, среди которых можно отметить Л. Рабинера, Б. Голда, М.А. Сапожкова, О.И. Шелухина,
A.B. Аграновского, В.Н. Сорокина, Р.В. Гудонавичюса, Ю.Н. Прохорова,
B.Г. Санникова, М.В. Хитрова, Е.Г. Жилякова и других. В основе многих из разработанных подходов используются частотные представления, так как порождаемые звуками речи отрезки PC обладают свойством концентрации энергии в достаточно «узких» полосах частотной оси. В связи с этим можно упомянуть рассматриваемое в литературных источниках разбиение частотной полосы на так называемые критические полосы слуха, которые
Наиболее интересным представляется алгоритм сегментации РС по границам звуков речи, основанный на определении расстояния между спектрами вида[80]:
£ (ЭД, і - М / 2) + Ж/ ,1 + А/ / 2) + )
440 = 2-2-==’ --------------- = (1.31)
(ад, / - / 2) + )21 (5(/,, ^ + А? / 2) + )2 ]
где А(/^) - динамический спектр сигнала (сонограмма); сгек - константа регуляризации.
На рисунках 1.12-1.13 представлены фрагмент сигнала,
соответствующий слову «черепаха», и результат оценки решающей функции при использовании алгоритма сегментации на основе корреляции между равноотстоящими спектрами.
Рисунок 1.12 — Фрагмент сигнала, соответствующий слову «черепаха»

Название работы	Автор	Дата защиты
Методы и средства синтеза автоматов мультибиометрической аутентификации	Майоров, Александр Викторович	2012
Модели информационных процессов и структур для повышения эффективности нейросетевого симулятора	Крючин, Олег Владимирович	2013
Асимптотические оценки корректирующих свойств и сложности декодирования двоичных кодов с малой плотностью проверок	Рыбин, Павел Сергеевич	2012

Электронная библиотека диссертаций

Разработка и исследование субполосных методов и алгоритмов сегментации речевых сигналов

Рекомендуемые диссертации данного раздела