+
Действующая цена700 499 руб.
Товаров:
На сумму:

Электронная библиотека диссертаций

Доставка любой диссертации в формате PDF и WORD за 499 руб. на e-mail - 20 мин. 800 000 наименований диссертаций и авторефератов. Все авторефераты диссертаций - БЕСПЛАТНО

Расширенный поиск

Рекуррентные авторегрессионные методы исследования речевых сигналов

  • Автор:

    Брауде-Золотарев, Михаил Юрьевич

  • Шифр специальности:

    05.12.13

  • Научная степень:

    Кандидатская

  • Год защиты:

    2000

  • Место защиты:

    Москва

  • Количество страниц:

    154 с. : ил.

  • Стоимость:

    700 р.

    499 руб.

до окончания действия скидки
00
00
00
00
+
Наш сайт выгодно отличается тем что при покупке, кроме PDF версии Вы в подарок получаете работу преобразованную в WORD - документ и это предоставляет качественно другие возможности при работе с документом
Страницы оглавления работы

ВВЕДЕНИЕ
ГЛАВА 1. АНАЛИЗ МЕТОДОВ НИЗКОСКОРОСТНОГО КОДИРОВАНИЯ РЕЧИ
1.1. Теоретические основы сжимающего кодирования
1.1.1. Верность воспроизведения и оценка качества речи
1.1.2. Методы рекуррентного анализа
1.2. Методы низкоскоростного кодирования речи
1.2.1. Линейное предсказание с кодовым возбуждением
1.2.2. Многополосное возбуждение, интерполяция формы и другие алгоритмы
1.3. Выводы по главе
ГЛАВА 2. АДАПТИВНЫЙ РЕКУРРЕНТНЫЙ КВАНТОВАТЕЛЬ
2.1. Известные алгоритмы квантования
2.2. Модель адаптивного рекуррентного квантования
2.2.1. Оценка текущего динамического диапазона речи
2.2.2. Взвешивание оценок динамического диапазона
2.2.3. Прореживание и интерполяция оценки динамического диапазона речи
2.2.4. Коэффициент нормировки
2.2.5. Детектирование пауз
2.2.6. Методика эксперимента
2.3. Оптимизация параметров модели
2.4. Выводы по главе
ГЛАВА 3. ЛИНЕЙНОЕ ПРЕДСКАЗАНИЕ НОРМАЛИЗОВАННОЙ РЕЧИ
3.1. Линейное предсказание
3.2. Исследование линейного предсказания нормализованной речи
3.2.1. Энергетический выигрыш предсказания
3.2.2. Корреляционные свойства разностных сигналов
3.2.3. Энергетические свойства параметров линейного предсказания
3.3. Оценка устойчивости
3.3.1. Обусловленность матрицы линейного предсказания
3.3.2. Спектральное расстояние между параметрами линейного предсказания
3.4. Качество синтеза линейного предсказания
3.5. Вычислительный выигрыш
3.6. Выводы по главе
ГЛАВА 4. РЕКУРРЕНТНОЕ ЛИНЕЙНОЕ ПРЕДСКАЗАНИЕ
4.1. Методы рекуррентного линейного предсказания
4.2. Взвешивающая фильтрация
4.3. Автокорреляционное реку ррентное линейное предсказание

4.4. Упрощенные методы вычисления корреляций
4.5. Выводы по главе
ПРИЛОЖЕНИЕ
Экспериментальные результаты (глава 2)
Экспериментальные результаты (глава 3)
Экспериментальные результаты (глава 4)
Графические материалы (главы 2, 3, 4)
ЛИТЕРАТУРА

Список используемых сокращении
АДИКМ — адаптивная дифференциальная импульсно-кодовая модуляция
АФ — анализирующий (отбеливающий) формантный фильтр
АКФ — автокорреляционная функция
ВКФ — взаимнокорреляционная функция
ДИКМ — дифференциальная импульсно-кодовая модуляция
ИКМ — импульсно-кодовая модуляция
ИХ — импульсная характеристика фильтра
КК — корреляционные коэффициенты
КП — коэффициенты предсказания
ЛСП — линейные спектральные пары
ЛСЧ — линейные спектральные частоты
ЛП — линейное предсказание
ОТ — основной тон речи
СФ - синтезирующий (формантный) фильтр
СКО -— среднеквадратическое отклонение
ФНЧ — фильтр нижних частот
40 — число обусловленности
AbS — анализ через синтез
CELP — линейное предсказание с кодовым возбуждением GSM — стандарт цифровой сотовой связи
НЕ LPC — линейное предсказание с гармоническим возбуждением
ITU — International Telecommunication Union (Международный союз электросвязи)
MOPS — миллион операций в секунду
MOS — субъективная средневзвешенная оценка качества речи PARCOR — метод частичных корреляций
RAM — оперативная память (оперативное запоминающее устройство)
ROM — энергонезависимая память (постоянное запоминающее устройство)
SNR — отношение сигнал/шум
TETRA — европейская транкинговая радиосвязь (Trans European Trunked Radio) WI — интерполяция формы

Преобразователь динамического диапазона состоит из устройства нормировки речи, детектора пауз (слабых шумовых сигналов), а квантователь производит квантование сигнала речи с выровненным динамическим диапазоном. Реализация основных перечисленных операций зависят от большого числа параметров, выбор которых непосредственно влияет на разрядность квантователя, достигаемый при этом отношение сигнал/шум (шумы квантования), и субъективное качество звучания. Перечислим основные из них:
• Способ оценки текущего динамического диапазона сигнала речи (далее обозначена Д/и)) — квадратичный (р=2) и линейный (р=1).
• Тип НЧ-фильтра. взвешивающего Д/и). и его «эффективная» постоянная времени (импульсная характеристика фильтра далее обозначена Ъ(п), а «эффективная» постоянная времени иг).
• Наличие и значение компенсации задержки, вносимой в оценку динамического диапазона НЧ-фильтром (обозначена так же. как и постоянная времени — иг).
• Коэффициент нормировки нормализуемого сигнала речи, определяющий вероятность ограничения восстановленного сигнала речи (Кнот)
• Детектирование «пауз» речевого сигнала для отключения или
ослабления механизма выравнивания динамического диапазона (порог отключения нормализации — Нд).
• Скорость прореживания оценок динамического диапазона речи.
• Способ интерполяции оценок динамического диапазона речи.
• Разрядность квантования оценок динамического диапазона (До).
• Разрядность квантования оценок нормализованной речи (Д.,).
Тогда формальная модель предлагаемого алгоритма записывается так
(символом /)[.] по-прежнему обозначена операция квантования):
Д(и) = {Д
(2.2.1),
= Д,ю/1„(и) — квантованный сигнал, а

Рекомендуемые диссертации данного раздела

Время генерации: 0.241, запросов: 967