+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Разработка и исследование субполосных методов и алгоритмов сегментации речевых сигналов

  • Автор:

    Фирсова, Александра Александровна

  • Шифр специальности:

    05.13.17

  • Научная степень:

    Кандидатская

  • Год защиты:

    2013

  • Место защиты:

    Белгород

  • Количество страниц:

    179 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

СОДЕРЖАНИЕ
ВВЕДЕНИЕ
ЕЛАВА 1 СОВРЕМЕННЫЕ МЕТОДЫ И АЛГОРИТМЫ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ
1.1 Основные характеристики звуков русской речи
1.2 Исследование существующих алгоритмов селекции пауз
1.3 Исследование существующих алгоритмов сегментации речевых
сигналов
1.4 Исследование существующих алгоритмов оценивания периода
основного тона
1.5 Основные положения субполосного анализа сигналов
1.6 Задачи исследования
ГЛАВА 2 СУБПОЛОСНЫЕ МОДЕЛИ ОТРЕЗКОВ РЕЧЕВЫХ СИГНАЛОВ И СЕЛЕКЦИЯ ПАУЗ МЕЖДУ ЗВУКАМИ РЕЧИ
2.1 Вычислительные аспекты субполосного анализа отрезков РС
2.2 Распределение энергий по частотным интервалам отрезков РС,
порождаемых разными звуками русской речи
2.3 Селекция пауз между звуками речи
2.4 Результаты и выводы главы
ГЛАВА 3 СЕГМЕНТАЦИЯ РЕЧЕВЫХ СИГНАЛОВ ПО ГРАНИЦАМ ЗВУКОВ РУССКОЙ РЕЧИ
3.1 Метод и алгоритм определения границ звуков русской речи..
3.2 Селекция вокализованных звуков русской речи и оценка периода
основного тона
3.3 Результаты и выводы главы
ГЛАВА 4 ПРОГРАММНАЯ РЕАЛИЗАЦИИ АЛГОРИТМОВ СЕГМЕНТАЦИИ РЕЧЕВЫХ СИГНАЛОВ
4.1 Описание структуры программной реализации алгоритмов
сегментации РС

4.2 Интерфейс прототипа программной поддержки алгоритмов сегментации РС
4.3 Рекомендации по выбору параметров
4.4 Результаты и выводы главы
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ПРИЛОЖЕНИЕ А
ПРИЛОЖЕНИЕ Б
ПРИЛОЖЕНИЕ В
ПРИЛОЖЕНИЕ Г
ПРИЛОЖЕНИЕ Д
ПРИЛОЖЕНИЕ Е

ВВЕДЕНИЕ
Актуальность диссертационного исследования. Устная речь является одной из наиболее естественных для человека форм информационного обмена. В соответствии с этим существенное внимание уделяется разработке методов автоматического анализа устной речи на компьютерах, одним из важнейших направлений развития которых является совершенствование человекомашинных интерфейсов. При этом обработке подвергаются речевые сигналы (PC), которые представляют собой результаты регистрации электромагнитных колебаний на выходе микрофонов, возбуждаемых акустическими воздействиями. В определенном смысле базовым этапом автоматического анализа устной речи служит сегментация PC на отрезки, которые порождены в разных условиях. Наибольший интерес представляет выделение участков, зарегистрированных при отсутствии звуков речи (селекция пауз, в том числе при сжатии речевых данных), определение границ участков, порождаемых разными звуками речи и определение среди последних отрезков, порождаемых вокализованными звуками (в задачах идентификации дикторов и оценки их психофизического состояния, распознавания речи и ее вокодерного синтеза с помощью липредеров и т.д).
Проблема анализа речевых сигналов рассматривалась в достаточно большом количестве работ зарубежных и российских авторов, среди которых можно отметить Л. Рабинера, Б. Голда, М.А. Сапожкова, О.И. Шелухина,
A.B. Аграновского, В.Н. Сорокина, Р.В. Гудонавичюса, Ю.Н. Прохорова,
B.Г. Санникова, М.В. Хитрова, Е.Г. Жилякова и других. В основе многих из разработанных подходов используются частотные представления, так как порождаемые звуками речи отрезки PC обладают свойством концентрации энергии в достаточно «узких» полосах частотной оси. В связи с этим можно упомянуть рассматриваемое в литературных источниках разбиение частотной полосы на так называемые критические полосы слуха, которые
Наиболее интересным представляется алгоритм сегментации РС по границам звуков речи, основанный на определении расстояния между спектрами вида[80]:
£ (ЭД, і - М / 2) + Ж/ ,1 + А/ / 2) + )
440 = 2-2-==’ --------------- = (1.31)
(ад, / - / 2) + )21 (5(/,, ^ + А? / 2) + )2 ]
где А(/^) - динамический спектр сигнала (сонограмма); сгек - константа регуляризации.
На рисунках 1.12-1.13 представлены фрагмент сигнала,
соответствующий слову «черепаха», и результат оценки решающей функции при использовании алгоритма сегментации на основе корреляции между равноотстоящими спектрами.
Рисунок 1.12 — Фрагмент сигнала, соответствующий слову «черепаха»

Рекомендуемые диссертации данного раздела

Время генерации: 0.122, запросов: 967