Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО
Фирсова, Александра Александровна
05.13.17
Кандидатская
2013
Белгород
179 с. : ил.
Стоимость:
499 руб.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
ЕЛАВА 1 СОВРЕМЕННЫЕ МЕТОДЫ И АЛГОРИТМЫ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ
1.1 Основные характеристики звуков русской речи
1.2 Исследование существующих алгоритмов селекции пауз
1.3 Исследование существующих алгоритмов сегментации речевых
сигналов
1.4 Исследование существующих алгоритмов оценивания периода
основного тона
1.5 Основные положения субполосного анализа сигналов
1.6 Задачи исследования
ГЛАВА 2 СУБПОЛОСНЫЕ МОДЕЛИ ОТРЕЗКОВ РЕЧЕВЫХ СИГНАЛОВ И СЕЛЕКЦИЯ ПАУЗ МЕЖДУ ЗВУКАМИ РЕЧИ
2.1 Вычислительные аспекты субполосного анализа отрезков РС
2.2 Распределение энергий по частотным интервалам отрезков РС,
порождаемых разными звуками русской речи
2.3 Селекция пауз между звуками речи
2.4 Результаты и выводы главы
ГЛАВА 3 СЕГМЕНТАЦИЯ РЕЧЕВЫХ СИГНАЛОВ ПО ГРАНИЦАМ ЗВУКОВ РУССКОЙ РЕЧИ
3.1 Метод и алгоритм определения границ звуков русской речи..
3.2 Селекция вокализованных звуков русской речи и оценка периода
основного тона
3.3 Результаты и выводы главы
ГЛАВА 4 ПРОГРАММНАЯ РЕАЛИЗАЦИИ АЛГОРИТМОВ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ
4.1 Описание структуры программной реализации алгоритмов
сегментации РС
4.2 Интерфейс прототипа программной поддержки алгоритмов сегментации РС
4.3 Рекомендации по выбору параметров
4.4 Результаты и выводы главы
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А
ПРИЛОЖЕНИЕ Б
ПРИЛОЖЕНИЕ В
ПРИЛОЖЕНИЕ Г
ПРИЛОЖЕНИЕ Д
ПРИЛОЖЕНИЕ Е
ВВЕДЕНИЕ
Актуальность диссертационного исследования. Устная речь является одной из наиболее естественных для человека форм информационного обмена. В соответствии с этим существенное внимание уделяется разработке методов автоматического анализа устной речи на компьютерах, одним из важнейших направлений развития которых является совершенствование человекомашинных интерфейсов. При этом обработке подвергаются речевые сигналы (PC), которые представляют собой результаты регистрации электромагнитных колебаний на выходе микрофонов, возбуждаемых акустическими воздействиями. В определенном смысле базовым этапом автоматического анализа устной речи служит сегментация PC на отрезки, которые порождены в разных условиях. Наибольший интерес представляет выделение участков, зарегистрированных при отсутствии звуков речи (селекция пауз, в том числе при сжатии речевых данных), определение границ участков, порождаемых разными звуками речи и определение среди последних отрезков, порождаемых вокализованными звуками (в задачах идентификации дикторов и оценки их психофизического состояния, распознавания речи и ее вокодерного синтеза с помощью липредеров и т.д).
Проблема анализа речевых сигналов рассматривалась в достаточно большом количестве работ зарубежных и российских авторов, среди которых можно отметить Л. Рабинера, Б. Голда, М.А. Сапожкова, О.И. Шелухина,
A.B. Аграновского, В.Н. Сорокина, Р.В. Гудонавичюса, Ю.Н. Прохорова,
B.Г. Санникова, М.В. Хитрова, Е.Г. Жилякова и других. В основе многих из разработанных подходов используются частотные представления, так как порождаемые звуками речи отрезки PC обладают свойством концентрации энергии в достаточно «узких» полосах частотной оси. В связи с этим можно упомянуть рассматриваемое в литературных источниках разбиение частотной полосы на так называемые критические полосы слуха, которые
Наиболее интересным представляется алгоритм сегментации РС по границам звуков речи, основанный на определении расстояния между спектрами вида[80]:
£ (ЭД, і - М / 2) + Ж/ ,1 + А/ / 2) + )
440 = 2-2-==’ --------------- = (1.31)
(ад, / - / 2) + )21 (5(/,, ^ + А? / 2) + )2 ]
где А(/^) - динамический спектр сигнала (сонограмма); сгек - константа регуляризации.
На рисунках 1.12-1.13 представлены фрагмент сигнала,
соответствующий слову «черепаха», и результат оценки решающей функции при использовании алгоритма сегментации на основе корреляции между равноотстоящими спектрами.
Рисунок 1.12 — Фрагмент сигнала, соответствующий слову «черепаха»
Название работы | Автор | Дата защиты |
---|---|---|
Расширение диапазона данных для вертикальной потоковой обработки применительно к сортировке со слиянием и параллельному поиску | Иванова, Анна Сергеевна | 2013 |
Разработка метода автоматического формирования рубрикатора полнотекстовых документов | Пескова, Ольга Вадимовна | 2008 |
Цифровой синтез многоракурсных стереоскопических изображений для безочковой растровой демонстрации | Кондратьев, Николай Витальевич | 2012 |