+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Помехоустойчивые выделители основного тона для низкоскоростных вокодеров и цифровых слуховых аппаратов

  • Автор:

    Бабкин, Владимир Владиславович

  • Шифр специальности:

    05.12.13

  • Научная степень:

    Кандидатская

  • Год защиты:

    2003

  • Место защиты:

    Санкт-Петербург

  • Количество страниц:

    210 с.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

1 Введение
1.1 Задача оценки частоты основного тона вокализованной речи и ее место в цифровой обработке речевых сигналов
1.2 Область применения алгоритмов оценки частоты ОТ вокализованной речи
1.3 Актуальность темы исследования
1.4 Цель работы
1.5 Структура диссертации
2 Обзор существующих методов оценки частоты ОТ
ВОКАЛИЗОВАННОЙ РЕЧИ
2.1 Постановка задачи оценки частоты ОТ вокализованной речи
2.2 Факторы, затрудняющие оценку частоты ОТ
2.3 Требования к точности оценки частоты ОТ в вокодерах
2.4 Общая структура построения выделителей ОТ
2.5 Методы предварительной обработки речевых сигналов
2.5.1 Линейная фильтрация
2.5.2 Выравнивание формантной структуры спектра
2.5.3 Нелинейные методы обогащения спектра гармониками частоты ОТ
2.6 Методы принятия решения
2.7 Общая классификация методов оценки частоты ОТ
2.8 Методы оценки частоты ОТ на основе анализа речевых сигналов во
временной области
2.8.1 Методы частотной селекции
2.8.2 Методы амплитудной селекции
2.8.3 Многоканальные схемы построения выделителей ОТ
2.8.3.1 Использование нескольких признаков для анализа
2.8.3.2 Использование различных методов предварительной обработки
2.8.3.3 Использование различных частотных полос
2.9 Методы оценки частоты ОТ на основе анализа функциональных отображений речевых сигналов
2.9.1 Корреляционные методы и методы линейного предсказания

2.9.1.1 Автокорреляционный метод
2.9.1.2 Разностные методы (АМЕШ и МБОБ)
'ф> 2.9.1.3 Метод, использующий функцию нормированной взаимной корреляции
2.9.1.4 Методы линейного предсказания высокого порядка
2.9.2 Методы, основанные на модификации спектра сигнала
2.9.2.1 Кепстральный метод
2.9.2.2 Другие методы модификации спектра
2.9.3 Методы максимального правдоподобия
2.9.4 Методы анализа через синтез
2.9.5 Методы поиска гармоник частоты ОТ в частотной области
2.9.5.1 Методы спектральной компрессии
2.9.5.2 Обнаружение гармоник ОТ с помощью гребенчатого фильтра
2.9.5.3 Корреляционный анализ спектров
2.9.5.4 Методы спектрального подобия
2.10 Методы классификации тон/шум
2.10.1 Общие подходы к классификации тон/шум для речевых сигналов
2.10.2 Подходы к классификации тон/шум в низкоскоростных вокодерах
2.10.3 Признаки, используемые при классификации тон/шум
2.10.4 Способы принятия решения тон/шум
2.11 Постановка задач исследования
2.12 Выводы
3 Исследование методов оценки частоты ОТ вокализованной речи
В ПРИСУТСТВИИ ШУМА И РАЗРАБОТКА ПОМЕХОУСТОЙЧИВОГО ВЫДЕЛИТЕЛЯ ОТ
3.1 Разработка методики оценки помехоустойчивости выделителей ОТ
3.1.1 Требования к тестовым сигналам
3.1.2 Количественная оценка помехоустойчивости
3.1.3 Формирование тестовых сигналов
^ 3.2 Выбор функционального отображения и исследование его свойств..
3.2.1 Корреляционные отображения
- '3.2.2 Отображения на основе гребенчатых фильтров
3.2.2.1 Гребенчатые КИХ и БИХ фильтры
3.2.2.2 Варианты построения отображений на основе гребенчатых фильтров
3.2.3 Сравнение свойств отображений на основе ФВНК и ФЭГФ
3.2.3.1 Качественное определение контрастности отображений
3.2.3.2 Количественное сравнение контрастности отображений
3.3 Исследование методов оценки периода ОТ для одного речевого кадра
3.3.1 Выделение глобального максимума отображения
3.3.2 Выделение глобального максимума взвешенного отображения
3.4 Сравнение методов предварительной фильтрации
3.5 Сглаживание траектории ОТ для нескольких кадров
3.5.1 Медианное сглаживание траектории ОТ
3.5.2 Сглаживание траектории ОТ методами динамического программирования
3.6 Выводы
4 Исследование помехоустойчивости разработанного выделителя ОТ
4.1 Описание алгоритма разработанного выделителя ОТ
4.2 Постановка эксперимента по измерению помехоустойчивости
4.3 Краткая характеристика сравниваемых выделителей ОТ
4.4 Полученные результаты
4.5 Выводы
5 Реализация разработанного выделителя ОТ
5.1 Особенности реализации алгоритмов цифровой обработки сигналов на цифровых процессорах обработки сигналов
5.1.1 Функциональное моделирование алгоритмов
5.1.2 Перевод алгоритмов в арифметику с фиксированной точкой
5.1.3 Разработка набора тестовых векторов
5.1.4 Реализация на ассемблере
5.1.5 Особенности многоканальной реализации
5.1.5.1 Метод раздельного программного кода
5.1.5.2 Метод переключения страниц памяти
5.1.5.3 Метод копирования контекстов
5.1.5.4 Метод переключения дескрипторов
5.2 Реализация разработанного выделителя ОТ в LPC вокодере
5.2.1 Общее описание реализованного вокодера
ла первой гармоники ОТ, например, в телефонном канале с полосой частот 300-3400 Гц. В этих случаях для обогащения спектра сигнала гармониками ОТ применяются различные нелинейные преобразования сигнала [38] (Hess, 1983). В патентах [31, 32] (Griffin, 1998) предложено после разбиения сигнала на частотные полосы в одной из них перед поиском ОТ проводить операцию возведения в квадрат |х(и)|2. Эта операция эквивалентна свертке спектра сигнала с самим собой и для вокализованных сигналов с дискретной структурой спектра порождает комбинационные частотные компоненты вида 3Fo - 2Fo, 5Fo - 4Fo и другие, являющиеся гармониками F<>. В [106] (Кемишис, 1982) для восстановления основной гармоники ОТ предложено для входного речевого сигнала, взятого в полосе частот 400-800 Гц, производить логарифмирование с последующей фильтрацией в полосе 80^100 Гц.
Основным недостатком предварительной нелинейной обработки сигнала в широкой полосе частот является снижение общей помехоустойчивости алгоритмов оценки частоты ОТ при низких значениях отношения сигнал/шум входных сигналов. Сигнал помехи после такой обработки перестает быть аддитивным, искажает речевой сигнал и порождает новые частотные составляющие помех. Поэтому следует крайне осторожно относится к внесению нелинейных искажений в сигнал перед анализом, особенно для сигналов с низким отношением сигнал/шум. Некоторые способы нелинейной обработки хорошо работают только для определенных условий - например для сигналов с ограниченным спектром или только для мужских голосов. Наряду с полезными эффектами нелинейные преобразования сигнала переносят шум в область низких частот. Поэтому нелинейные методы предварительной обработки чаще используется при многоканальном построении выделителей ОТ когда объединяются результаты работы несколько каналов с различной нелинейной обработкой и без нее, как это сделано в патентах [31, 32] (Griffin, 1998) в МВБ вокодере. В [49] (Karjalainen, 1999) сигнал разделяется на две частотные полосы 80-1000 Гц и выше 1000 Гц. В ВЧ полосе проводится однополупериодное детектирование и

Рекомендуемые диссертации данного раздела

Время генерации: 0.132, запросов: 967